概述
基数排序(Radix Sorting)
基数排序是和前面所述各类排序方法完全不相同的一种排序方法。前述各类排序方法都是建立在关键字比较的基础上,而基数排序不比较关键字的大小,它是根据关键字中各位的值,通过对待排序记录进行若干趟“分配”与“收集”来实现排序的,是一种借助于多关键字排序的思想对单关键字排序的方法。
一、多关键字的排序
先看一个具体例子。已知扑克牌中52张牌的次序关系为♣2<♣3<...<♣A<♦2<♦3<...<♦A<♥2<♥3<...<♥A<♠2<♠3<...<♠A
每一张牌有两个“关键字”:花色(♣<♦<♥<♠)和面值(2<3<...<A),且“花色”的地位高于“面值”,在比较任意两种牌面的大小时,必须先比较“花色”,若“花色”相同,则再比较面值。
由此,将扑克牌整理成如上所述次序关系时,有以下两种排序法:
1.最高位优先法:先按不同“花色”分成有次序的4堆,每一堆的牌均具有相同的“花色”,然后分别对每一堆按“面值”大小整理有序。
2.最低位优先法:这是一种“分配”与“收集”交替进行的方法。
1)先按不同“面值”分成13堆。
2)然后将这13堆牌自小至大叠在一起(“3”在“2”之上,“4”在“3”之上,...,最上面的4张“A”)。
3)然后将每堆按照面值的次序收集到一起,再重新对这些牌按不同“花色”分成4堆。
4)最后将这4堆牌按花色的次序再收集到一起(♣在最下面,♠在最上面)。
二、链式基数排序
[算法思想]
基数排序的思想类似于上述“最低位优先法”的洗牌过程,是借助“分配”和“收集”两种操作对单逻辑关键字进行排序的一种内部排序方法。有的逻辑关键字可以看成由若干个关键字复合而成的。
例如,若关键字是数值,且其值都在0<=K<=999范围内,则可把每一个十进制数字看成一个关键字,即可认为K由3个关键字(K0,K1,K2)组成,其中K0是百位数,K1是十位数,K2是个位数;
又若关键字K是由5个字母组成的单词,则可看成是由5个关键字(K0,K1,K2,K3,K4)组成,其中K(j-1)是(自左至右的)第j个字母。由于如此分解而得的每个关键字Kj都在相同范围内(对数字,0<=Kj<=9,对字母‘A’<=Kj<=‘Z’),故可以按照“分配”和“收集”的方法进行排序。
假设记录的逻辑关键字由d个“关键字”组成,每个关键字可能去rd个值。只要从最低数位关键字起,按关键字的不同值将序列中记录“分配”到rd个队列中后再“收集”之,如此重复d次完成排序。按照这种方法实现排序称之为基数排序,其中“基”指的是rd的取值范围,在上述两种关键字的情况下,rd分别为“10”和“26”。
具体实现时,一般采用链式基数排序。
先看一个具体的例子。首先以链表存储n个待排记录,并令表头指针指向第一个记录,如图(a)所示,然后通过以下三趟“分配”和“收集”操作来完成排序。
在第一趟分配对最低数位关键字(个位数)进行,改变记录的指针值将链表中的记录分配到10个链队列中去,每个队列中的关键字的个数相等,如图(b)所示,其中f[i]和e[i]分别为第i队列的头指针和尾指针;第一趟收集是改变所有非空队列的队尾记录的指针域,令其指向下一个非空队列的队头记录,重新将10个队列中的记录链成一个链表,如图(c)所示;
第二趟分配和第二趟收集是对十位数进行的,其过程和个位数相同。分配和收集结果分别如图(d)和图(e)所示。
第三趟分配和第三趟收集是对百位数进行的,过程同上,分配和收集结果分别如图(f)和图(g)所示。至此排序完毕
算法实现时采用静态链表,以便于更有效地存储和重排记录。相关数据类型的定义如下:
#define MAXNUM_KEY 8
/* 关键字项数的最大值 */
#define RADIX 10
/* 关键字基数,此时是十进制整数的基数 */
#define MAX_SPACE 10000
typedef struct
{
KeysType keys[MAXNUM_KEY];
/* 关键字 */
InfoType otheritems;
/* 其他数据项 */
int next;
}SLCell;
/* 静态链表的结点类型*/
typedef struct
{
SLCell r[MAX_SPACE];
/* 静态链表的可利用空间,r[0]为头结点*/
int keynum;
/* 记录的当前关键字个数 */
int recnum;
/* 静态链表的当前长度 */
}SLList;
/* 静态链表类型 */
typedef int ArrType[RADIX]
/* 指针数组类型 */
[算法描述]
/* 分配 */
void Distribute(SLCell &r, int i, ArrType &f, ArrType &e)
{
/* 静态链表L的r域中记录已按(keys[0],...,keys[i-1])有序 */
/* 本算法按照第i个关键字建立RADIX个子表,使同一子表中记录的keys[i]相同 */
/* f[0..RADIX-1]和e[0..RADIX-1]分别指向各子表中第一个和最后一个记录 */
for(int j=0;j<RADIX;++j)
/* 各子表初始化为空表 */
for(int p=r[0].next;p;p=r[p].next)
{
j=ord(r[p].keys[i]);
/* ord将记录中第i个关键字映射到[0..RADIX-1] */
if(!f[j]) f[j]=p;
else r[e[j]].next=p;
e[j]=p;
/* 将p所指的结点插入第j个子表中 */
}
}
/* 收集 */
void Collect(SLCell &r,int i,ArrType f,ArrType e)
{
/* 本算法按keys[i]自小至大地将f[0..RADIX-1]所指各子表依次链接成一个链表 */
/* e[0..RADIX-1]为各子表的尾指针 */
int j;
for(j=0;!f[j];j=succ(j));
/* 找到第一个非空子表,succ为求后继函数 */
r[0].next=f[j];t=e[j];
/* r[0].next指向一个非空子表中的第一个结点 */
while(j<RADIX)
{
for(j=succ(j);j<RADIX-1&&!f[i];j=succ(j));
if(f[j]) {r[t].next=f[j];t=e[j];}
}
r[t].next=0;
}
void RadixSort(SLList &L)
{
/* L是采用静态链表表示的顺序表 */
/* 对L做基数排序,使得L成为按关键字自小到大的有序静态链表,L.r[0]为头结点 */
for(int i=0;i<L.recnum;++i) L.r[i].next=i+1;
L.r[L.recnum].next=0;
/* 将L改造为静态链表 */
for(int i=0;i<L.keynum;++i)
/* 按最低位优先依次对各关键字进行分配和收集 */
{
Distribute(L.r,i,f,e);
/* 第i趟分配 */
Collect(L.r,i,f,e);
/* 第i趟收集 */
}
}
[算法分析]
1.时间复杂度
对于n个记录(加色每个记录含d个关键字,每个关键字的取值范围为rd个值)进行链式基数排序时,每一趟分配的时间复杂度为O(n),每一趟收集的时间复杂度为O(rd),整个排序需进行d趟分配和收集,所以时间复杂度为O(d(n+rd))。
2.空间复杂度
所需辅助空间为2rd个队列指针,另外由于需用链表做存储结构,则相对于其他以顺序结构存储记录的排序方法而言,还增加了n个指针域的空间,所以空间复杂度为O(n+rd)。
[算法特点]
(1)是稳定排序。
(2)可用于链式结构,也可用于顺序结构。
(3)时间复杂度可以突破基于关键字比较一类方法的下界(nlog2n),达到O(n)。
(4)基数排序可使用条件有严格的要求:需要知道各级关键字的主次关系和各级关键字的取值范围。
附:虽然知道了基数排序的思想,但代码实现的过程不太了解。
这里给出一个写的比较好的基数排序总结
最后
以上就是俭朴皮带为你收集整理的【基数排序】的全部内容,希望文章能够帮你解决【基数排序】所遇到的程序开发问题。
如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。
发表评论 取消回复