《数据结构第9章排序.ppt》由会员分享,可在线阅读,更多相关《数据结构第9章排序.ppt(103页珍藏版)》请在三一办公上搜索。
1、1,数据结构课程的内容,2,9.1 概述9.2 插入排序9.3 交换排序9.4 选择排序9.5 归并排序9.6 基数排序,第9章 内部排序,3,9.1 概述,1.什么是排序?将一组杂乱无章的数据按一定的规律顺次排列起来。,2.排序的目的是什么?,存放在数据表中,按关键字排序,3.排序算法的好坏如何衡量?时间效率排序速度(即排序所花费的全部比较次数)空间效率占内存辅助空间的大小稳定性若两个记录A和B的关键字值相等,但排序后A、B的先后次序保持不变,则称这种排序算法是稳定的。,便于查找!,4,4.什么叫内部排序?什么叫外部排序?,若待排序记录都在内存中,称为内部排序;若待排序记录一部分在内存,一部
2、分在外存,则称为外部排序。,注:外部排序时,要将数据分批调入内存来排序,中间结果还要及时放入外存,显然外部排序要复杂得多。,5.待排序记录在内存中怎样存储和处理?,顺序排序排序时直接移动记录;链表排序排序时只移动指针;地址排序排序时先移动地址,最后再移动记录。,注:地址排序中可以增设一维数组来专门存放记录的地址。,5,注:大多数排序算法都是针对顺序表结构的(便于直接移动元素),6.顺序存储(顺序表)的抽象数据类型如何表示?,Typedef struct/定义每个记录(数据元素)的结构 KeyType key;/关键字 InfoType otherinfo;/其它数据项RecordType;,T
3、ypedef struct/定义顺序表的结构 RecordType r MAXSIZE+1;/存储顺序表的向量/r0一般作哨兵或缓冲区 int length;/顺序表的长度SqList;,#define MAXSIZE 20/设记录不超过20个typedef int KeyType;/设关键字为整型量(int型),6,7.内部排序的算法有哪些?,按排序的规则不同,可分为5类:插入排序交换排序(重点是快速排序)选择排序归并排序基数排序,d关键字的位数(长度),按排序算法的时间复杂度不同,可分为3类:简单的排序算法:时间效率低,O(n2)先进的排序算法:时间效率高,O(nlog2n)基数排序算算法
4、:时间效率高,O(dn),7,9.2 插入排序,插入排序的基本思想是:,插入排序有多种具体实现算法:1)直接插入排序 2)折半插入排序 3)2-路插入排序 4)表插入排序 5)希尔排序,每步将一个待排序的对象,按其关键码大小,插入到前面已经排好序的一组对象的适当位置上,直到对象全部插入为止。,简言之,边插入边排序,保证子序列中随时都是排好序的。,8,1)直接插入排序,新元素插入到哪里?,例1:关键字序列T=(13,6,3,31,9,27,5,11),请写出直接插入排序的中间过程序列。,【13】,6,3,31,9,27,5,11【6,13】,3,31,9,27,5,11【3,6,13】,31,9
5、,27,5,11【3,6,13,31】,9,27,5,11【3,6,9,13,31】,27,5,11【3,6,9,13,27,31】,5,11【3,5,6,9,13,27,31】,11【3,5,6,9,11,13,27,31】,在已形成的有序表中线性查找,并在适当位置插入,把原来位置上的元素向后顺移。,最简单的排序法!,9,例2:关键字序列T=(21,25,49,25*,16,08),请写出直接插入排序的具体实现过程。,*表示后一个25,i=1,21,i=2,i=3,i=5,i=4,i=6,25,25,25,49,49,49,25*,49,16,16,08,49,解:假设该序列已存入一维数组V
6、7中,将V0作为缓冲或暂存单元(Temp)。则程序执行过程为:,初态:,16,25,21,16,完成!,时间效率:O(n2)因为在最坏情况下,所有元素的比较次数总和为(01n-1)O(n2)。其他情况下还要加上移动元素的次数。空间效率:O(1)因为仅占用1个缓冲单元算法的稳定性:稳定因为25*排序后仍然在25的后面。对应程序参见教材P265。,10,若设待排序的对象个数为n,则算法需要进行n-1次插入。最好情况下,排序前对象已经按关键码大小从小到大有序,每趟只需与前面的有序对象序列的最后一个对象的关键码比较 1 次,移动 2 次对象。因此,总的关键码比较次数为n-1,对象移动次数为 2(n-1
7、)。,直接插入排序的算法分析,11,最坏情况下,第i趟插入时,第i个对象必须与前面i-1个对象都做关键码比较,并且每做 1 次比较就要做 1 次数据移动。则总的关键码比较次数KCN和对象移动次数RMN分别为,12,若待排序对象序列中出现各种可能排列的概率相同,则可取上述最好情况和最坏情况的平均情况。在平均情况下的关键码比较次数和对象移动次数约为 n2/4。因此,直接插入排序的时间复杂度为 o(n2)。直接插入排序是一种稳定的排序方法。,13,2)折半插入排序,优点:比较的次数大大减少,全部元素比较次数仅为O(nlog2n)。时间效率:虽然比较次数大大减少,可惜移动次数并未减少,所以排序效率仍为
8、O(n2)。空间效率:O(1)稳定性:稳定 对应程序见教材P267(仅用于顺序表),新元素插入到哪里?,讨论:若记录是链表结构,用直接插入排序行否?折半插入排序呢?答:直接插入不仅可行,而且还无需移动元素,时间效率更高!自测卷上有对应的程序设计题。,折半插入排序的改进2-路插入排序见教材P267。,在已形成的有序表中折半查找,并在适当位置插入,把原来位置上的元素向后顺移。,但链表无法“折半”!,14,折半插入排序的算法分析,折半查找比顺序查找快,所以折半插入排序就平均性能来说比直接插入排序要快。在插入第 i 个对象时,需要经过 log2i+1 次关键码比较,才能确定它应插入的位置。因此,将 n
9、 个对象用折半插入排序所进行的关键码比较次数为:n*log2n折半插入排序是一个稳定的排序方法。,15,4)表插入排序,基本思想:在顺序存储结构中,给每个记录增开一个指针分量,在排序过程中将指针内容逐个修改为已经整理(排序)过的后继记录地址。优点:在排序过程中不移动元素,只修改指针。,回忆:链表排序排序时只移动指针;地址排序排序时先移动地址,最后再移动记录。,此方法具有链表排序和地址排序的特点。,16,1,例:关键字序列 T=(21,25,49,25*,16,08),请写出表插入排序的具体实现过程。,解:假设该序列(结构类型)已存入一维数组V7中,将V0作为表头结点。则算法执行过程为:,指向第
10、1个元素,指向头结点,初态i=1,i=2,i=3,i=4,i=5,i=6,0,3,4,5,6,5,0,3,1,0,2,*表示后一个25,17,int LinkInsertSort(staticlinklis/形成循环链表,表插入排序的算法,for(int i=2;i link),list.vi.Link=current;/新记录vi找到合适序位开始插入 list.vpre.Link=i;/在pre与current之间链入,18,表插入排序算法分析:,无需移动记录,只需修改2n次指针值。但由于比较次数没有减少,故时间效率仍为O(n2)。空间效率肯定低,因为增开了指针分量(但在运算过程中没有用到更
11、多的辅助单元)。稳定性:25和25*排序前后次序未变,稳定。讨论:此算法得到的只是一个有序链表,查找记录时只能满足顺序查找方式。改进:可以根据表中指针线索,很快对所有记录重排,形成真正的有序表(顺序存储方式),从而能满足折半查找方式。具体实现见教材P269。,19,5)希尔(shell)排序(又称缩小增量排序),基本思想:先将整个待排记录序列分割成若干子序列,分别进行直接插入排序,待整个序列中的记录“基本有序”时,再对全体记录进行一次直接插入排序。技巧:子序列的构成不是简单地“逐段分割”,而是将相隔某个增量dk的记录组成一个子序列,让增量dk逐趟缩短(例如依次取5,3,1),直到dk1为止。优
12、点:让关键字值小的元素能很快前移,且序列若基本有序时,再用直接插入排序处理,时间效率会高很多。,20,38,例:关键字序列 T=(49,38,65,97,76,13,27,49*,55,04),请写出希尔排序的具体实现过程。,初态:,第1趟(dk=5),第2趟(dk=3),第3趟(dk=1),49,13,13,49,38,27,65,49*,97,55,76,04,27,38,65,49*,97,55,13,55,76,04,55,13,27,04,27,04,49,49*,49,49*,76,38,76,65,65,97,97,13,27,04,49*,76,97,算法分析:开始时dk 的值
13、较大,子序列中的对象较少,排序速度较快;随着排序进展,dk 值逐渐变小,子序列中对象个数逐渐变多,由于前面工作的基础,大多数对象已基本有序,所以排序速度仍然很快。,ri,21,void ShellSort(SqList&L,int dlta,int t)/按增量序列dlta0t-1对顺序表L作Shell排序 for(k=0;kt;+k)ShellSort(L,dltak);/增量为dltak的一趟插入排序/ShellSort,时间效率:,空间效率:O(1)因为仅占用1个缓冲单元算法的稳定性:不稳定因为49*排序后却到了49的前面,希尔排序算法(主程序),参见教材P272,O(n1.25)O(1
14、.6n1.25)经验公式,dk值依次装在dltat中,22,附:希尔排序算法分析,对特定的待排序对象序列,可以准确地估算关键码的比较次数和对象移动次数。但想要弄清关键码比较次数和对象移动次数与增量选择之间的依赖关系,并给出完整的数学分析,还没有人能够做到。Knuth利用大量的实验统计资料得出,当n很大时,关键码平均比较次数和对象平均移动次数大约在 n1.25 到 1.6n1.25 的范围内。这是在利用直接插入排序作为子序列排序方法的情况下得到的。,23,void ShellInsert(SqList j=j-dk)rj+dk=rj;rj+dk=r0;,希尔排序算法(其中某一趟的排序操作),参见
15、教材P272,/对顺序表L进行一趟增量为dk的Shell排序,dk为步长因子,/开始将ri 插入有序增量子表,/暂存在r0,/关键字较大的记录在子表中后移,/在本趟结束时将ri插入到正确位置,24,课堂练习:,1.欲将序列(Q,H,C,Y,P,A,M,S,R,D,F,X)中的关键码按字母升序重排,则初始步长为4的希尔排序一趟的结果是?答:原始序列:Q,H,C,Y,P,A,M,S,R,D,F,X shell一趟后:,2.以关键字序列(256,301,751,129,937,863,742,694,076,438)为例,分别写出执行以下算法的各趟排序结束时,关键字序列的状态,并说明这些排序方法中,
16、哪些易于在链表(包括各种单、双、循环链表)上实现?直接插入排序 希尔排序(取dk=5,3,1),答:显然,直接插入排序方法易于在链表上实现;但希尔排序方法因为是按增量选择记录,不易于在链表上实现。两种排序方法的中间状态分别描述如后:,25,原始序列:256,301,751,129,937,863,742,694,076,438,256,301,751,129,937,863,742,694,076,438256,301,751,129,937,863,742,694,076,438129,256,301,751,937,863,742,694,076,438129,256,301,751,93
17、7,863,742,694,076,438129,256,301,751,863,937,742,694,076,438129,256,301,742,751,863,937,694,076,438129,256,301,694,742,751,863,937,076,438076,129,256,301,694,742,751,863,937,438076,129,256,301,438,694,742,751,863,937,直接插入排序,第1趟第2趟第3趟第4趟第5趟第6趟第7趟第8趟第9趟,26,原始序列:256,301,751,129,937,863,742,694,076,438,
18、希尔排序,(取dk=5,3,1),256,301,751,129,937,863,742,694,076,438,256,301,751,129,937,863,742,694,076,438,256,301,694,129,937,863,742,751,076,438,256,301,694,076,937,863,742,751,129,438,256,301,694,076,438,863,742,751,129,937,第1趟dk=5第2趟dk=3第3趟dk=1,256,301,694,076,438,863,742,751,129,937,256,301,694,076,438,8
19、63,742,751,129,937,076,301,694,256,438,863,742,751,129,937,076,301,694,256,438,863,742,751,129,937,076,301,694,256,438,863,742,751,129,937,076,301,129,256,438,694,742,751,863,937,076,301,129,256,438,694,742,751,863,937,076,301,129,256,438,694,742,751,863,937,076,129,256,301,438,694,742,751,863,937,2
20、7,9.3 交换排序,两两比较待排序记录的关键码,如果发生逆序(即排列顺序与排序后的次序正好相反),则交换之,直到所有记录都排好序为止。,交换排序的主要算法有:1)冒泡排序 2)快速排序,交换排序的基本思想是:,28,1)冒泡排序,基本思路:每趟不断将记录两两比较,并按“前小后大”(或“前大后小”)规则交换。优点:每趟结束时,不仅能挤出一个最大值到最后面位置,还能同时部分理顺其他元素;一旦下趟没有交换发生,还可以提前结束排序。前提:顺序存储结构,例:关键字序列 T=(21,25,49,25*,16,08),请写出冒泡排序的具体实现过程。,21,25,49,25*,16,0821,25,25*,
21、16,08,4921,25,16,08,25*,4921,16,08,25,25*,4916,08,21,25,25*,4908,16,21,25,25*,49,初态:第1趟第2趟第3趟第4趟第5趟,29,冒泡排序的算法分析,时间效率:O(n2)因为要考虑最坏情况空间效率:O(1)只在交换时用到一个缓冲单元稳 定 性:稳定 25和25*在排序前后的次序未改变,详细分析:最好情况:初始排列已经有序,只执行一趟起泡,做 n-1 次关键码比较,不移动对象。最坏情形:初始排列逆序,算法要执行n-1趟起泡,第i趟(1 i n)做了n-i 次关键码比较,执行了n-i 次对象交换。此时的比较总次数KCN和记
22、录移动次数RMN为:,30,2)快速排序,从待排序列中任取一个元素(例如取第一个)作为中心,所有比它小的元素一律前放,所有比它大的元素一律后放,形成左右两个子表;然后再对各子表重新选择中心元素并依此规则调整,直到每个子表的元素只剩一个。此时便为有序序列了。,基本思想:,优点:因为每趟可以确定不止一个元素的位置,而且呈指数增加,所以特别快!前提:顺序存储结构,31,(),,设以首元素为枢轴中心,例1:关键字序列 T=(21,25,49,25*,16,08),请写出快速排序的算法步骤。,21,25,49,25*,16,08,初态:第1趟:第2趟:第3趟:,讨论:1.这种不断划分子表的过程,计算机如
23、何自动实现?2.“快速排序”是否真的比任何排序算法都快?,08,16,21,25,25*,(49),21,16,08,,(),25,25*,49,(08),16,21,,25,(25*,49),32,1.这种不断划分子表的过程,计算机如何自动实现?,编程时:每一趟的子表的形成是采用从两头向中间交替式逼近法;由于每趟中对各子表的操作都相似,主程序可采用递归算法。,见教材P275,int Partition(SqList/以子表的首记录作为支点记录,放入r0单元(续下页),一趟快速排序算法(针对一个子表的操作),33,pivotkey=rlow.key;/取支点的关键码存入pivotkey变量,w
24、hile(low=pivotkey)-high;rlow=rhigh;/将比支点小的记录交换到低端;while(lowhigh/将比支点大的记录交换到高端;,rlow=r0;/支点记录到位;return low;/返回支点记录所在位置。/Partition,34,Low=high=3,本趟停止,将支点定位并返回位置信息,例2:关键字序列 T=(21,25,49,25*,16,08),请写出快速排序算法的一趟实现过程。,high,low,21,08,25,16,49,25*,3,21,pivotkey=21,08,25,16,49,(08,16)21(25*,49,25),25*跑到了前面,不稳
25、定!,35,j从高端扫描寻找小于pivot的元素,i从低端扫描寻找大于pivot的元素,一趟快速排序算法流程图,36,void QSort(SqList,整个快速排序的递归算法:,见教材P276,/长度1,/对顺序表L中的子序列r lowhigh 作快速排序,/一趟快排,将r 一分为二,/在左子区间进行递归快排,直到长度为1,/在右子区间进行递归快排,直到长度为1,/QSort,新的low,void QuickSort(SqList,对顺序表L进行快速排序的操作函数为:,37,例3:以关键字序列(256,301,751,129,937,863,742,694,076,438)为例,写出执行快速
26、算法的各趟排序结束时,关键字序列的状态。,原始序列:256,301,751,129,937,863,742,694,076,438,快速排序,第1趟第2趟第3趟第4趟,256,301,751,129,937,863,742,694,076,438,076,129,256,751,937,863,742,694,301,438,要求模拟算法实现步骤,256,076,301,129,751,256,076,129,256,438,301,694,742,694,863,937,751,076,129,256,438,301,694,742,751,863,937,076,129,256,301,3
27、01,694,742,751,863,937,438,076,129,256,301,438,694,742,751,863,937,时间效率:O(nlog2n)因为每趟确定的元素呈指数增加空间效率:O(log2n)因为算法的递归性,要用到栈空间稳 定 性:不稳定 因为可选任一元素为支点。,38,快速排序算法详细分析:,快速排序是递归的,需要有一个栈存放每层递归调用时的指针和参数(新的low和high)。可以证明,函数quicksort的平均计算时间也是O(nlog2n)。实验结果表明:就平均计算时间而言,快速排序是我们所讨论的所有内排序方法中最好的一个。最大递归调用层次数与递归树的深度一致,
28、理想情况为 log2(n+1)。因此,要求存储开销为 o(log2n)。如果每次划分对一个对象定位后,该对象的左侧子序列与右侧子序列的长度相同,则下一步将是对两个长度减半的子序列进行排序,这是最理想的情况。此时,快速排序的趟数最少。,39,在最坏的情况,即待排序对象序列已经按其关键码从小到大排好序的情况下,其递归树成为单支树,每次划分只得到一个比上一次少一个对象的子序列。这样,必须经过 n-1 趟才能把所有对象定位,而且第 i 趟需要经过 n-i 次关键码比较才能找到第 i 个对象的安放位置,总的关键码比较次数将达到n2/2 快速排序是一个不稳定的排序方法,40,讨论2.“快速排序”是否真的比
29、任何排序算法都快?,设每个子表的支点都在中间(比较均衡),则:第1趟比较,可以确定1个元素的位置;第2趟比较(2个子表),可以再确定2个元素的位置;第3趟比较(4个子表),可以再确定4个元素的位置;第4趟比较(8个子表),可以再确定8个元素的位置;只需log2n 1趟便可排好序。,基本上是!因为每趟可以确定的数据元素是呈指数增加的!,而且,每趟需要比较和移动的元素也呈指数下降,加上编程时使用了交替逼近技巧,更进一步减少了移动次数,所以速度特别快。,教材P276有证明:快速排序的平均排序效率为O(nlog2n);但最坏情况(例如已经有序)下仍为O(n2),改进措施见P277。,41,基本思想是:
30、每一趟(例如第 i 趟,i=0,1,n-2)在后面 n-i 个待排序对象中选出排序码最小的对象,作为有序对象序列的第 i 个对象。待到第 n-2 趟作完,待排序对象只剩下1个,就不用再选了。,9.4 选择排序,42,若它不是这组对象中的第一个对象,则将它与这组对象中的第一个对象对调;在这组对象中剔除这个具有最小排序码的对象。在剩下的对象Vi+1Vn-1中重复执行第、步,直到剩余对象只有一个为止。,直接选择排序是一种简单的排序方法,它的基本步骤是:在一组对象 ViVn-1 中选择具有最小排序码的对象;,直接选择排序(Select Sort),43,21,25,49,25*,16,08,0 1 2
31、 3 4 5,21,25*,i=0,49,25,16,25,16,08,49,08,25*,49,21,i=1,i=2,08,16,25*,25,21,初始,最小者 08交换21,08,最小者 16交换25,16,最小者 21交换49,21,44,49,25*,0 1 2 3 4 5,25*,i=4,25,16,08,49,25*,49,21,结果,i=3,08,16,25,21,最小者 25*无交换,最小者 25无交换,25,21,16,08,各趟排序后的结果,45,直接选择排序的算法typedef int SortData;void SelectSort(SortData V,int n)
32、for(int i=0;i n-1;i+)int k=i;/选择具有最小排序码的对象 for(int j=i+1;j n;j+)if(Vj Vk)k=j;/当前具最小排序码的对象 if(k!=i)/对换到第 i 个位置 Swap(Vi,Vk);,46,0 1 2 3 4 5,49,16,08,25*,49,21,08,25*,25,21,i=1时选择排序的过程,i k j,49,25,08,25*,16,21,i k j,49 25,25*25,16,25,i k j,16 25,47,49,25,08,25*,16,21,0 1 2 3 4 5,i k j,21 16,k 指示当前序列中最小
33、者,直接选择排序的排序码比较次数 KCN 与对象的初始排列无关。设整个待排序对象序列有 n 个对象,则第 i 趟选择具有最小排序码对象所需的比较次数总是 n-i-1 次。总的排序码比较次数为,48,锦标赛排序(Tournament Tree Sort),它的思想与体育比赛时的淘汰赛类似。首先取得 n 个对象的关键码,进行两两比较,得到 n/2 个比较的优胜者(关键码小者),作为第一步比较的结果保留下来。然后对这 n/2 个对象再进行关键码的两两比较,如此重复,直到选出一个关键码最小的对象为止。在图例中,最下面是对象排列的初始状态,相当于一棵满二叉树的叶结点,它存放的是所有参加排序的对象的关键码
34、。,49,如果 n 不是2的 k 次幂,则让叶结点数补足到满足 2k-1 n 2k 的2k个。叶结点上面一层的非叶结点是叶结点关键码两两比较的结果。最顶层是树的根。,08,Winner,21,08,08,63,25*,21,21,25,49,25*,16,08,63,tree7 tree8 tree9 tree10 tree11 tree12 tree13 tree14,50,胜者树的概念,每次两两比较的结果是把关键码小者作为优胜者上升到双亲结点,称这种比赛树为胜者树。位于最底层的叶结点叫做胜者树的外结点,非叶结点称为胜者树的内结点。每个结点除了存放对象的关键码 data 外,还存放了此对象是
35、否要参选的标志 Active 和此对象在满二叉树中的序号index。胜者树最顶层是树的根,表示最后选择出来的具有最小关键码的对象。,51,08,Winner(胜者),21,08,08,63,25*,21,21,25,49,25*,16,08,63,tree7 tree8 tree9 tree10 tree11 tree12 tree13 tree14,形成初始胜者树(最小关键码上升到根),a0,关键码比较次数:6,52,16,Winner(胜者),21,16,16,63,25*,21,21,25,49,25*,16,63,tree7 tree8 tree9 tree10 tree11 tree
36、12 tree13 tree14,输出冠军并调整胜者树后树的状态,a1,关键码比较次数:2,53,21,Winner(胜者),21,63,63,25*,21,21,25,49,25*,63,tree7 tree8 tree9 tree10 tree11 tree12 tree13 tree14,输出亚军并调整胜者树后树的状态,a2,关键码比较次数:2,54,25,Winner(胜者),25,63,63,25*,25,25,49,25*,63,tree7 tree8 tree9 tree10 tree11 tree12 tree13 tree14,输出第三名并调整胜者树后树的状态,a3,关键码比
37、较次数:2,55,25*,Winner(胜者),25*,63,63,25*,49,25*,63,tree7 tree8 tree9 tree10 tree11 tree12 tree13 tree14,输出第四名并调整胜者树后树的状态,a4,关键码比较次数:2,56,63,Winner(胜者),63,63,63,tree7 tree8 tree9 tree10 tree11 tree12 tree13 tree14,全部比赛结果输出时树的状态,a6,关键码比较次数:2,57,胜者树数据结点类的定义template class DataNode public:Type data;/数据值 int
38、 index;/结点在满二叉树中顺序号 int active;/参选标志:=1,参选,=0,不参选锦标赛排序的算法 template void TournamentSort(Type a,int n)DataNode*tree;DataNode item;,58,int bottomRowSize=PowerOfTwo(n);/乘幂值 int TreeSize=2*bottomRowSize-1;/总结点个数 int loadindex=bottomRowSize-1;/内结点个数 tree=new DataNodeTreeSize;int j=0;/从 a 向胜者树外结点复制数据 for(i
39、nt i=loadindex;i TreeSize;i+)treei.index=i;if(j n)treei.active=1;treei.data=aj+;else treei.active=0;i=loadindex;/进行初始比较选择最小的项 while(i),59,j=i;while(j 2*i)if(!treej+1.active|/胜者送入双亲 treej.data=treej+1.data)tree(j-1)/2=treej;else tree(j-1)/2=treej+1;j+=2;i=(i-1)/2;/i 退到双亲,直到 i=0为止 for(i=0;i n-1;i+)/处理
40、其它n-1个数据 ai=tree0.data;/送出最小数据 treetree0.index.active=0;/失去参选资格,60,UpdateTree(tree,tree0.index);/调整 an-1=tree0.data;锦标赛排序中的调整算法template void UpdateTree(DataNode*tree,int i)if(i%2=0)tree(i-1)/2=treei-1;/i偶数,对手左结点 else tree(i-1)/2=treei+1;/i奇数,对手右结点 i=(i-1)/2;/向上调整,61,while(i)/直到 i=0 if(i%2=0)j=i-1;el
41、se j=i+1;if(!treei.active|!treej.active)if(treei.active)tree(i-1)/2=treei;/i可参选,i上 else tree(i-1)/2=treej;/否则,j上 else/两方都可参选 if(treei.data treej.data)tree(i-1)/2=treei;/关键码小者上 else tree(i-1)/2=treej;i=(i-1)/2;/i上升到双亲,62,算法分析,锦标赛排序构成的树是满的完全二叉树,其深度为 log2(n+1),其中 n 为待排序元素个数。除第一次选择具有最小关键码的对象需要进行 n-1 次关键
42、码比较外,重构胜者树选择具有次小、再次小关键码对象所需的关键码比较次数均为 O(log2n)。总关键码比较次数为O(nlog2n)。对象的移动次数不超过关键码的比较次数,所以锦标赛排序总的时间复杂度为O(nlog2n)。这种排序方法虽然减少了许多排序时间,但是使用了较多的附加存储。,63,如果有 n 个对象,必须使用至少 2n-1 个结点来存放胜者树。最多需要找到满足 2k-1 n 2k 的k,使用 2*2k-1 个结点。每个结点包括关键码、对象序号和比较标志三种信息。锦标赛排序是一个稳定的排序方法。,64,堆排序(Heap Sort),利用堆及其运算,可以很容易地实现选择排序的思路。堆排序分
43、为两个步骤:第一步,根据初始输入数据,利用堆的调整算法 HeapAdjust()形成初始堆,第二步,通过一系列的对象交换和重新调整堆进行排序。,65,建立初始的最大堆,21,25,25*,49,16,08,1,2,3,4,5,6,i,21,25,25*,16,49,08,1,3,6,5,4,2,i,21 25 49 25*16 08,初始关键码集合,21 25 49 25*16 08,i=2 时的局部调整,66,21,25,25*,49,16,08,1,2,3,4,5,6,i,49,25,25*,16,21,08,1,3,6,5,4,2,21 25 49 25*16 08,49 25 21 2
44、5*16 08,i=0 时的局部调整形成最大堆,i=1 时的局部调整,67,最大堆的向下调整算法,Type SqList HeapType;Void HeapAdjust(HeapType,68,将表转换成堆for(i=H.length/2;i0;-i)(从最下层的分支结点向上)HeapAdjust(H,i,H.length);,69,基于初始堆进行堆排序,最大堆的第一个对象H0具有最大的关键码,将H0与Hn对调,把具有最大关键码的对象交换到最后,再对前面的n-1个对象,使用堆的调整算法HeapAdjust(H,0,n-1),重新建立最大堆。结果具有次最大关键码的对象又上浮到堆顶,即H0位置。
45、再对调V0和Vn-1,调用HeapAdjust(H,0,n-2),对前n-2个对象重新调整,。如此反复执行,最后得到全部排序好的对象序列。这个算法即堆排序算法,其细节在下面的程序中给出。,70,49,25,25*,21,16,08,1,2,3,4,5,6,08,25,25*,16,21,49,1,3,6,5,4,2,49 25 21 25*16 08,08 25 21 25*16 49,交换 0 号与 5 号对象,5 号对象就位,初始最大堆,71,25,25*,08,21,16,49,1,2,3,4,5,6,16,25*,08,25,21,49,1,3,6,5,4,2,25 25*21 08
46、16 49,16 25*21 08 25 49,交换 0 号与 4 号对象,4 号对象就位,从 0 号到 4 号 重新调整为最大堆,72,25*,16,08,21,25,49,1,2,3,4,5,6,08,16,25*,25,21,49,1,3,6,5,4,2,25*16 21 08 25 49,08 16 21 25*25 49,交换 0 号与 3 号对象,3 号对象就位,从 0 号到 3 号 重新调整为最大堆,73,21,16,25*,08,25,49,1,2,3,4,5,6,08,16,25*,25,21,49,1,3,6,5,4,2,21 16 08 25*25 49,08 16 21
47、 25*25 49,交换 0 号与 2 号对象,2 号对象就位,从 0 号到 2 号 重新调整为最大堆,74,16,08,25*,21,25,49,1,2,3,4,5,6,08,16,25*,25,21,49,1,3,6,5,4,2,16 08 21 25*25 49,08 16 21 25*25 49,交换 0 号与 1 号对象,1 号对象就位,从 0 号到 1 号 重新调整为最大堆,75,堆排序的算法/对表H1到Hn进行排序,使得表中各/个对象按其关键码非递减有序。Void HeapSort(HeapType(从根结点向下),76,算法分析,若设堆中有 n 个结点,且 2k-1 n 2k,
48、则对应的完全二叉树有 k 层。在第 i 层上的结点数 2i(i=0,1,k-1)。在第一个形成初始堆的for循环中对每一个非叶结点调用了一次堆调整算法HeapAdjust(),因此该循环所用的计算时间为:其中,i 是层序号,2i 是第 i 层的最大结点数,(k-i-1)是第 i 层结点能够移动的最大距离。,77,在第二个for循环中,调用了n-1次HeapAdjust()算法,该循环的计算时间为O(nlog2n)。因此,堆排序的时间复杂性为O(nlog2n)。该算法的附加存储主要是在第二个for循环中用来执行对象交换时所用的一个临时对象。因此,该算法的空间复杂性为O(1)。堆排序是一个不稳定的
49、排序方法。,78,对象的移动次数与对象序列的初始排列有关。当这组对象的初始状态是按其排序码从小到大有序的时候,对象的移动次数RMN=0,达到最少。最坏情况是每一趟都要进行交换,总的对象移动次数为 RMN=3(n-1)。直接选择排序是一种不稳定的排序方法。,79,9.5 归并排序(Merge Sort),归并,是将两个或两个以上的有序表合并成一个新的有序表。原始序列initList 中两个有序表 initListl initListm和initListm+1 initListn。它们可归并成一个有序表,存于另一对象序列mergedList的 l n 中。这种归并方法称为两路归并(2-way me
50、rging)。设变量 i 和 j 是表initListl m和initList m+1 n的当前检测指针。k 是存放指针。,归并,80,08 21 25 25*49 62 72 93,16 37 54,left mid mid+1 right,initList,i j,08 16 21 25 25*37 49 54 62 72 93,left right,k,mergeList,当 i 和 j 都在两个表的表长内变化时,根据对应项的排序码的大小,依次把排序码小的对象排放到新表 k 所指位置中;当 i 与 j 中有一个已经超出表长时,将另一 个表中的剩余部分照抄到新表中。,81,迭代的归并排序算