概述
对于区间第k大值,除了我们之前介绍的归并树之外。现在要登场的数据结构将比归并树的效率更高,他就是划分树。我们学习归并树的时候了解到:归并树 = 线段树 + 归并排序。那么我们今天要介绍的划分树就是:线段树 + 快排。要说有什么不同的,那就是归并树是从有序到无序,而划分树是从无序到有序。
1、划分树的定义
给定一序列a[1...n],sorted[1...n]为序列从小到大的排列结果。对于划分树的每一个节点(叶子节点除外),其保存的区间[left, right]中小于等于sorted[(left+right)/2]的进入该结点的左子树,否则进入该节点的右子树。如图所示:
从划分树的定义来看,我们不难发现我们使用层状的储存较为方便于是我们,定义划分树的储存结构如下:
const int MAXN = 100001;
const int DEEP = 18;
//DEEP = ceil(log2(MAXN))+1
//ceil是天花板函数,ceil(x)的取值为大于等于x的最小整数
using namespace std;
typedef struct{
int num[MAXN]; //num记录第k层当前位置的元素的值
int cnt[MAXN]; //cnt记录元素所在区间的当前位置之前进入左孩子的个数
}PartitionTree;
PartitionTree tree[DEEP];
int sorted[MAXN]; //对原来集合中的元素排序后的值。
2、建树
我们知道只要小于等于当前结点的区间中值的数字就进入左子树,否则进入右子树。为了方便我们的查询我们增加一个数组cnt[1...n]用来记录元素所在区间的当前位置之前进入左孩子的个数。根据这些信息我们可以写出建树的代码,如下:
void build(int deep, int lft, int rht){
if(lft == rht) return ;
int mid = (lft + rht) >> 1;
int scnt = mid - lft + 1;
//为了使划分树的每一节点的元素等于区间长度
//我们对于相等的数,就不能全部放到左子树
//只能放一部分给左子树
//下面是计算能够放几个与sorted[mid]相等的数到左子树
for(int i = lft; i <= rht; i++){
if(tree[deep].num[i] < sorted[mid]) scnt--;
}
int p = lft, r = mid + 1;
for(int i = lft, cnt_in_left = 0; i <= rht; i++){
int num = tree[deep].num[i];
//如果小于sorted[mid]或者相等且scnt!=0,那么则放入左子树
if(num < sorted[mid] || (num == sorted[mid] && scnt)){
if(num == sorted[mid]) scnt--;
cnt++;
tree[deep+1].num[p++] = num;
}//否则进入右子树
else tree[deep+1].num[r++] = num;
//记录元素所在区间的当前位置之前进入左孩子的个数
tree[deep].cnt[i] = cnt_in_left;
}
//递归建树
build(deep+1, lft, mid);
build(deep+1, mid+1, rht);
}
3、查询
划分树的查询只要想明白了,他就很简单。我们在文章前面已经明白了,划分树的定义以及是如何建树的。划分树的查询就是基于我们建树时保存的信息,就是那个cnt数组。如果我们要查找区间[qlft, qrht]内的第k大数,这里就可以小小的是有下cnt数组了。如果tree[deep].cnt[qrht] - tree[deep].cnt[qlft-1] >= K。区间[qlft, qrht]内有超过k个值进入左子树,我们不难发现我们的目标值,已经进入了左子树。反之如果tree[deep].cnt[qrht] - tree[deep].cnt[qlft-1] < K,那么我们的目标值则进入了右子树。于是我们顺藤摸瓜就能找到目标值了,如:
那么,现在对于查询我们还有一个问题要解决,那就是更新查询的区间。什么意思呢,就是原先我们查找的是[4,7]这个区间内的第k大数,那么当我们进入右子树之后,已经不存在[4,7]这个区间了,既然区间都没有了,那么自然k也就变了。经过一番思考,我们可以得到查询代码如下:
//deep为树的深度,[lft, rht]为节点对应的区间
//查询区间[qlft, qrht]中的第k大值
int query(int deep, int lft, int rht, int qlft, int qrht, int k){
//但区间仅剩下一个点了,显然我们已经找到答案了
if(lft == rht) return tree[deep].num[lft];
int mid = (lft + rht) >> 1;
//left表示区间[lft, qlft-1]中进入左子树中的元素个数
//sum_in_left表示区间[qlft, qrht]进入左子树的元素个数
//当查询区间的左边界qlft等于结点区间的左边界lft时,
//left = 0, sum_in_left = tree[deep].cnt[qrht]
int left = 0, sum_in_left = tree[deep].cnt[qrht];
//当他们不重叠的时候
//那么left=tree[deep].cnt[qlft-1],sum_in_left=tree[deep].cnt[qrht]-tree[deep].cnt[qlft-1]
//至于为什么要分情况讨论,就留给读者慢慢思考了
if(qlft != lft){
left = tree[deep].cnt[qlft-1];
sum_in_left -= left;
}
//目标值在左子树
if(sum_in_left >= k){
int new_qlft = lft + left;
int new_qrht = new_qlft + sum_in_left - 1;
return query(deep+1, lft, mid, new_qlft, new_qrht, k);
}
//目标值在右子树
else{
int a = qlft - lft - left;
int b = qrht - qlft - sum_in_left;
int new_qlft = mid + 1 + a;
int new_qrht = new_qlft + b;
return query(deep+1, mid+1, rht, new_qlft, new_qrht, k-sum_in_left);
}
}
3、复杂度
很容易得出时间复杂度为总的时间复杂度为O(n log n)。每一次查询的时间复杂度为O(logn)。空间复杂度为O(n*logn)。显然划分树的时间复杂度要优于归并树。
4、实战演练
pku2104 K-th Number
hdu 2665 Kth number
前两个是基础,后一个是上面所得带sum域的加强版。
hdu 3743 Minium_Number
附上pku2104的代码:
#include <cstdio>
#include <algorithm>
using namespace std;
const int MAXN = 100000 + 1;
const int DEEP = 18;
typedef struct{
int num[MAXN];
int cnt[MAXN];
}PartitionTree;
PartitionTree tree[DEEP];
int sorted[MAXN];
void build(int deep, int lft, int rht){
if(lft == rht) return ;
int mid = (lft + rht) >> 1;
int key = sorted[mid];
int scnt = mid - lft + 1;
for(int i = lft; i <= rht; ++i){
if(tree[deep].num[i] < key) --scnt;
}
int p = lft-1, r = mid;
for(int i = lft, cnt = 0; i <= rht; ++i){
int num = tree[deep].num[i];
if(num < key || (num == key && scnt)){
if(num == key) --scnt;
++cnt;
tree[deep+1].num[++p] = num;
}
else tree[deep+1].num[++r] = num;
tree[deep].cnt[i] = cnt;
}
build(deep+1, lft, mid);
build(deep+1, mid+1, rht);
}
int query(int deep, int lft, int rht, int qlft, int qrht, int k){
if(lft == rht) return tree[deep].num[lft];
int mid = (lft + rht) >> 1;
int left = 0, sum_in_left = tree[deep].cnt[qrht];
if(lft != qlft){
left = tree[deep].cnt[qlft-1];
sum_in_left -= left;
}
if(sum_in_left >= k){
int new_qlft = lft + left;
int new_qrht = new_qlft + sum_in_left - 1;
return query(deep+1, lft, mid, new_qlft, new_qrht, k);
}
else{
int a = qlft - lft - left;
int b = qrht - qlft - sum_in_left;
int new_qlft = mid + 1 + a;
int new_qrht = new_qlft + b;
return query(deep+1, mid+1, rht, new_qlft, new_qrht, k-sum_in_left);
}
}
int main(){
int n, m, qlft, qrht, k;
scanf("%d%d", &n, &m);
for(int i = 1; i <= n; i++){
scanf("%d", &sorted[i]);
tree[0].num[i] = sorted[i];
}
sort(sorted+1, sorted+1+n);
build(0, 1, n);
while(m--){
scanf("%d%d%d", &qlft, &qrht, &k);
printf("%dn", query(0, 1, n, qlft, qrht, k));
}
return 0;
}
最后
以上就是飞快海燕为你收集整理的划分树1、划分树的定义2、建树3、查询3、复杂度4、实战演练的全部内容,希望文章能够帮你解决划分树1、划分树的定义2、建树3、查询3、复杂度4、实战演练所遇到的程序开发问题。
如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。
发表评论 取消回复