《《数据结构用C语言描述》第八章j.ppt》由会员分享,可在线阅读,更多相关《《数据结构用C语言描述》第八章j.ppt(79页珍藏版)》请在三一办公上搜索。
1、概述插入排序交换排序选择排序归并排序基数排序各种内排方法比较,第八章 排序,概 述,排序:将一个数据元素的任意序列,重新排列成一个按关键字有序的序列。数据表(datalist):它是待排序数据对象的有限集合。主关键字(key):数据对象有多个属性域,即多个数据成员组成,其中有一个属性域可用来区分对象,作为排序依据,称为关键字。也称为关键字。,排序方法的稳定性:如果在对象序列中有两 个对象ri和rj,它们的关键字 ki=kj,且在排序之前,对象ri排在rj前面。如果在排序之后,对象ri仍在对象rj的前面,则称这个排序方法是稳定的,否则称这个排序方法是不稳定的。内排序与外排序:内排序是指在排序期间
2、数据对象全部存放在内存的排序;外排序是指在排序期间全部对象个数太多,不能同时存放在内存,必须根据排序过程的要求,不断在内、外存之间移动的排序。,排序的时间开销:排序的时间开销是衡量算法好坏的最重要的标志。排序的时间开销可用算法执行中的数据比较次数与数据移动次数来衡量。typedef struct int key;datatype other;rectype;rectype Rn;,内排序分类,依不同原则插入排序、交换排序、选择排序、归并排序、和基数排序等。依所须工作量简单排序-时间复杂度o(n2)先进排序方法-时间复杂度o(n logn)基数排序-时间复杂度o(d.n),插入排序(Insert
3、 Sorting),基本思想 当插入第i(i 1)个对象时,前面的R0,R1,Ri-1已经排好序。这时,用Ri的关键字与Ri-1,Ri-2,的关键字顺序进行比较,找到插入位置即将Ri插入,原来位置上的对象向后顺移。,基本思想 每步将一个待排序的对象,按其关键字大小,插入到前面已经排好序的一组对象的适当位置上,直到对象全部插入为止。,直接插入排序(Insert Sort),直接插入排序过程,0 1 2 3 4 5 temp,i=1,i=2,21,25,08,49,25*,16,25,21,25,08,49,25*,16,i=3,21,25,08,49,25*,16,25*,21,25,08,49
4、,25*,16,i=4,i=5,直接插入排序的算法 InsertSort(rectype R,int n)int i,j;for(i=2;i n;i+)R0=Ri;j=i 1;/从后向前顺序比较 while(R0.key Rj.key)Rj+1=Rj-;Rj+1=R0;,算法分析,设待排序对象个数为 n,则该算法的主程序执行n-1趟。关键字比较次数和对象移动次数与对象关键字的初始排列有关。最好情况下,排序前对象已按关键字从小到大有序,每趟只需与前面有序对象序列的最后一个对象比较1次,移动2次对象,总的关键字比较次数为 n-1,对象移动次数为 2(n-1)。,最坏情况下,第 i 趟时第 i 个对
5、象必须与前面 i 个对象都做关键字比较,并且每做1次比较就要做1次数据移动。则总关键字比较次数KCN和对象移动次数RMN分别为在平均情况下的关键字比较次数和对象移动次数约为 n2/4。因此,直接插入排序的时间复杂度为 o(n2)。直接插入排序是一种稳定的排序方法。,折半插入排序(Binary Insertsort),基本思想 设在顺序表中有一 个对象序列 R0,R1,Rn-1。其中,R0,R1,Ri-1 是已经排好序的对象。在插入Ri 时,利用折半搜索法寻找Ri 的插入位置。,折半插入排序的算法,typedef int SortData;Roid BinInsSort(SortData R,i
6、nt n)SortData temp;int Left,Right;for(int i=1;i=Left;k-)Rk+1=Rk;/记录后移 RLeft=temp;/插入,折半插入排序,0 1 2 3 4 5 temp,i=1,i=2,0 1 2 3 4 5 temp,5,21,3,3,i=3,5,5,21,5,3,21,4,4,i=4,21,5,3,8,8,i=5,21,5,3,16,16,8,4,4,21,3,8,4,5,16,折半搜索比顺序搜索查找快,所以折半插入排序就平均性能来说比直接插入排序要快。它所需的关键字比较次数与待排序对象序列的初始排列无关,仅依赖于对象个数。在插入第 i 个对
7、象时,需要经过 log2i+1 次关键字比较,才能确定它应插入的位置。因此,将 n 个对象(为推导方便,设为 n=2k)用折半插入排序所进行的关键字比较次数为:,算法分析,当 n 较大时,总关键字比较次数比直接插入排序的最坏情况要好得多,但比其最好情况要差。在对象的初始排列已经按关键字排好序或接近有序时,直接插入排序比折半插入排序执行的关键字比较次数要少。折半插入排序的对象移动次数与直接插入排序相同,依赖于对象的初始排列。折半插入排序是一个稳定的排序方法。折半插入排序的时间复杂度为o(n2)。,希尔排序(Shell Sort),基本思想设待排序对象序列有 n 个对象,首先取一个整数 gap n
8、 作为间隔,将全部对象分为 gap 个子序列,所有距离为 gap 的对象放在同一个子序列中,在每一个子序列中分别施行直接插入排序。然后缩小间隔 gap,例如取 gap=gap/2,重复上述的子序列划分和排序工作。直到最后取 gap=1,将所有对象放在同一个序列中排序为止。希尔排序方法又称为缩小增量排序。,i=3,Gap=3,0 1 2 3 4 5,i=2,Gap=2,21,08,25,49,25*,16,i=1,Gap=1,希尔排序过程,ShellSort(rectype R,int n)rectype temp;int gap=n/2;/gap是间隔 while(gap!=0)/循环,直到g
9、ap为零 for(int i=gap;i=gap;j=j-gap)if(temp Rj-gap)Rj=Rj-gap;else break;Rj=temp;gap=(int)(gap/2);,希尔排序的算法,开始时 gap 的值较大,子序列中的对象较少,排序速度较快;随着排序进展,gap 值逐渐变小,子序列中对象个数逐渐变多,由于前面大多数对象已基本有序,所以排序速度仍然很快。Gap的取法有多种。shell 提出取 gap=n/2,gap=gap/2,直到gap=1。对特定的待排序对象序列,可以准确地估算关键字的比较次数和对象移动次数。希尔排序所需的比较次数和移动次数约为n 1.3当n趋于无穷时
10、可减少到n(log2 n)2,交换排序(Exchange Sort),基本方法设待排序对象序列中的对象个数为n。一般地,第i趟起泡排序从1到n-i+1依次比较相邻两个记录地关键字,如果发生逆序,则交换之,其结果是这n-i+1个记录中,关键字最大的记录被交换到第n-i+1的位置上,最多作n-1趟。,基本思想是两两比较待排序对象的关键字,如发生逆序(即排列顺序与排序后的次序正好相反),则交换之,直到所有对象都排好序为止。,起泡排序(Bubble Sort),21,08,25,49,25,16,21,49,25,25,16,08,21,49,25,25,16,08,初始关键字,第一趟排序,第四趟排序
11、,第二趟排序,第三趟排序,21,49,25,25,16,08,第五趟排序,起泡排序的过程,21,08,25,49,25,16,初始关键字,第一趟排序,第四趟排序,第二趟排序,第三趟排序,第五趟排序,起泡排序的过程,起泡排序的算法BubbleSort(rectype R,int n)int i,j,noswap;rectype temp;for(i=0;i=i;j-)if(Rj+1.key Rj.key)/逆序 temp=R j+1;/交换 R j+1=R j;R j=temp;noswap=0;/标志置为0,有交换 if(noswap)break;思考题:如何实现双起泡,第i趟对待排序对象序列
12、Ri-1,Ri,Rn-1进行排序,结果将该序列中关键字最小的对象交换到序列的第一个位置(i-1),其它对象也都向排序的最终位置移动。最多做n-1趟起泡就能把所有对象排好序。在对象的初始排列已经按关键字从小到大排好序时,此算法只执行一趟起泡,做n-1次关键字比较,不移动对象。这是最好的情形。,最坏的情形是算法执行n-1趟起泡,第i趟(1 i n)做 n-i 次关键字比较,执行 n-i 次对象交换。这样在最坏情形下总的关键字比较次数KCN和对象移动次数RMN为:,起泡排序是一个稳定的排序方法。,快速排序(Quick Sort),基本思想是任取待排序对象序列中的某个对象(例如取第一个对象)作为基准,
13、按照该对象的关键字大小,将整个对象序列划分为左右两个子序列:左侧子序列中所有对象的关键字都小于或等于基准对象的关键字 右侧子序列中所有对象的关键字都大于基准对象的关键字,基准对象则排在这两个子序列中间(这也是该对象最终应安放的位置)。然后分别对这两个子序列重复施行上述方法,直到所有的对象都排在相应位置上为止。基准对象也称为枢轴(或支点)记录。,QuickSort(List)if(List的长度大于1)将序列List划分为两个子序列 LeftList 和 Right List;QuickSort(LeftList);QuickSort(RightList);将两个子序列 LeftList 和 R
14、ightList 合并为一个序列List;,快速排序算法描述,快速排序的过程,21,08,25,49,25*,16,初始关键字,08,25,49,25*,16,21,08,25,49,25*,16,08,25,49,25*,16,08,25,49,25*,16,08,25,49,25*,16,21,prikey,一次交换,二次交换,三次交换,四次交换,完成一趟排序,i,j,i,j,j,i,08,25,49,25*,16,21,完成一趟排序,分别进行快速排序,08,25,49,25*,16,21,有序序列,08,25,49,25*,16,21,快速排序的算法 QuickSort(rectype
15、R,int low,int high)/在序列lowhigh 中递归地进行快速排序 if(low high)int i=Partition(R,low,high);/划分 QuickSort(R,low,i-1);/对左序列同样处理 QuickSort(R,i+1,high);/对右序列同样处理,int Partition(rectype R,int low,int high)R0=Rlow;/子表的第一个记录作基准对象 tempkey=Rlow.key;/基准对象关键字 While(low=tempkey)high-;Rlow=Rhigh;/小于基准的移到区间的左侧 While(lowhig
16、h,算法quicksort是一个递归的算法,其递归树如图所示。算法partition利用序列第一个对象作为基准,将整个序列划分为左右两个子序列。算法中执行了一个循环,只要是关键字小于基准对象关键字的对象都移到序列左侧,最后基准对象安放到位,函数返回其位置。,算法分析,快速排序的趟数取决于递归树的高度。如果每次划分对一个对象定位后,该对象的左侧子序列与右侧子序列的长度相同,则下 一步将是对两个长度减半的子序列进行排序,这是最理想的情况。在 n个元素的序列中,对一个对象定位所需时间为 O(n)。若设 t(n)是对 n 个元素的序列进行排序所需的时间,而且每次对一个对 象正确定位后,正好把序列划分为
17、长度相等的两个子序列,此时,总的计算时间为:,T(n)cn+2T(n/2)/c 是一个常数 cn+2(cn/2+2T(n/4)=2cn+4T(n/4)2cn+4(cn/4+2T(n/8)=3cn+8T(n/8)cn log2n+nT(1)=O(n log2n)可以证明,函数quicksort的平均计算时间也是O(nlog2n)。实验结果表明:就平均计算时间而言,快速排序是所有内排序方法中最好的一个。快速排序是递归的,需要有一个栈存放每层递归调用时的指针和参数。,最大递归调用层次数与递归树的高度一致,理想情况为 log2(n+1)。因此,要求存储开销为 O(log2n)。在最坏的情况,即待排序对
18、象序列已经按其关键字从小到大排好序的情况下,其递归树成为单支树,每次划分只得到一个比上一次少一个对象的子序列。总的关键字比较次数将达快速排序是一种不稳定的排序方法。,基本思想 每一趟(例如第 i 趟,i=0,1,n-2)在后面 n-i 个待排序记录中选出关键字最小的记录,作为有序序列中的第 i 个记录。待到第n-2 趟作完,待排序记录只剩下1个,就不用再选了。,选择排序,直接选择排序是一种简单的排序方法,它的基本步骤是:在一组对象 RiRn-1 中选择具有最小关键字的对象;若它不是这组对象中的第一个对象,则将它与这组对象中的第一个对象对调;在这组对象中剔除这个具有最小关键字的对象。在剩下的对象
19、Ri+1Rn-1中重复执行第、步,直到剩余对象只有一个为止。,直接选择排序(Select Sort),直接选择排序的过程,最小者 25*无交换,直接选择排序的算法SelectSort(rectype R,int n)int i,j,k;rectype temp;for(i=0;i n-1;i+)k=i;/选择具有最小关键字的对象 for(j=i+1;j n;j+)if(Rj.key Rk.key)k=j;/当前具最小关键字的对象 if(k!=i)/对换到第 i 个位置 temp=Ri;Ri=Rk;Rk=temp;,直接选择排序的关键字比较次数 KCN 与对象的初始排列无关。设整个待排序对象序列
20、有 n 个对象,则第 i 趟选择具有最小关键字对象所需的比较次数总是 n-i-1 次。总的关键字比较次数为,对象的移动次数与对象序列的初始排列有关。当这组对象的初始状态是按其关键字从小到大有序的时候,对象的移动次数RMN=0,达到最少。最坏情况是每一趟都要进行交换,总的对象移动次数为 RMN=3(n-1)。直接选择排序是一种不稳定的排序方法。,堆排序(Heap sort),堆(Heap)设有一个关键字集合,按完全二叉树的顺序存储方式存放在一个一维数组中。对它们从根开始,自顶向下,同一层自左向右从 0开始连续编号。若满足 Ki K2i&Ki K2i+1或 Ki K2i&Ki K2i+1,则称该关
21、键字集合构成一个堆。前者成为小根堆,后者称为大根堆。,堆排序(Heap Sort)利用堆及其运算,可以很容易地实现选择排序的思路。堆排序分为两个步骤 根据初始输入数据,利用堆的调整算法 SIFT()形成初始堆;通过一系列的对象交换和重新调整堆进行排序。,自下向上逐步调整为小根堆,初始小根堆的建立过程,53,17,17,78,78,09,23,45,65,87,i,09,23,45,65,87,i=1,i,53,53,17,17,78,78,09,23,45,65,87,i,09,23,45,65,87,i,53,建成堆,初始大根堆的建立过程,21,25,25*,49,16,08,1,2,3,4
22、,5,6,i,21,25,25*,16,49,08,1,3,6,5,4,2,i,初始关键字集合,i=3 时的局部调整,21,25,25*,49,16,08,1,2,3,4,5,6,i,49,25,25*,16,21,08,1,3,6,5,4,2,大根堆的筛选算法,SIFT(rectype R,int i,int m)int j=2*i;rectype temp=Ri;while(j=Rj)break;else,Ri=Rj;/大子女上移 i=j;j=2*i;/向下继续调整 Ri=temp;/回放到合适位置,将表转换成堆for(i=n/2;i=1;i-)SIFT(R,i,n);,基于初始堆(大顶堆
23、)进行堆排序,最大堆堆顶R0具有最大的关键字,将R0与 Rn-1对调,把具有最大关键字的对象交换到最后,再对前面的n-1个对象,使用堆的调整算法SIFT(0,n-2),重新建立最大堆,具有次最大关键字的对象又上浮到R0位置。再对调R0和Rn-2,调用SIFT(0,n-3),对前n-2个对象重新调整,。如此反复执行,最后得到全部排序好的对象序列。这个算法即堆排序算法,,49,25,25*,21,16,08,0,1,2,3,4,5,08,25,25*,16,21,49,0,2,5,4,3,1,49 25 21 25*16 08,08 25 21 25*16 49,交换 0 号与 5 号对象,5 号
24、对象就位,初始最大堆,基于初始堆进行堆排序,25,25*,08,21,16,49,0,1,2,3,4,5,16,25*,08,25,21,49,0,2,5,4,3,1,25 25*21 08 16 49,16 25*21 08 25 49,交换 0 号与 4 号对象,4 号对象就位,从 0 号到 4 号 重新调整为最大堆,25*,16,08,21,25,49,0,1,2,3,4,5,08,16,25*,25,21,49,0,2,5,4,3,1,25*16 21 08 25 49,08 16 21 25*25 49,交换 0 号与 3 号对象,3 号对象就位,从 0 号到 3 号 重新调整为最大
25、堆,21,16,25*,08,25,49,0,1,2,3,4,5,08,16,25*,25,21,49,0,2,5,4,3,1,21 16 08 25*25 49,08 16 21 25*25 49,交换 0 号与 2 号对象,2 号对象就位,从 0 号到 2 号 重新调整为最大堆,16,08,25*,21,25,49,0,1,2,3,4,5,08,16,25*,25,21,49,0,2,5,4,3,1,16 08 21 25*25 49,08 16 21 25*25 49,交换 0 号与 1 号对象,1 号对象就位,从 0 号到 1 号 重新调整为最大堆,堆排序的算法HeapSort(rec
26、type R)/对表R1到Rn进行排序,使得表中对象关键字非递减有序。int i;rectype temp;for(i=n/2;i=1;i-)SIFT(R,i,n);/初始堆 for(i=n;i=1;i-)temp=R1;R1=Ri;/交换 Ri=temp;SIFT(R,1,i-1);/重建最大堆,若设堆中有 n 个结点,且 2k-1 n 2k,则对应的完全二叉树有 k 层。在第 i 层上的结点数 2i(i=0,1,k-1)。在第一个形成初始堆的 for 循环中对每一个非叶结点调用了 一次堆调整算法SIFT(),因此该循环所用的计算时间为:其中,i 是层序号,2i 是第 i 层的最大结点数,(
27、k-i-1)是第 i 层结点能够移动的最大距离。,堆排序的算法分析,第二个for循环中调用了n-1次SIFT()算法,该循环的计算时间为O(nlog2n)。因此,堆排序的时间复杂性为O(nlog2n)。该算法的附加存储主要是在第二个for循环中用来执行对象交换时所用的一个临时对象。因此,该算法的空间复杂性为O(1)。堆排序是一个不稳定的排序方法。,归并排序(Merge Sort),归并将两个或两个以上的有序表合并成一个新的有序表。两路归并(2-way merging)原始序列R 中两个有序表 Rl Rm和Rm+1 Rn,它们可归并成一个有序表,存于另一对象序列R1的 l n 中。,08 21
28、25 25*49 62 72 93,16 37 54,low mid mid+1 high,R,08 16 21 25 25*37 49 54 62 72 93,low high,k,R1,设变量 i 和 j 是表Rl m和R m+1 n的当前检测指针。k 是存放指针。当 i 和 j 都在两个表的表长内变化时,根据对应项的关键字的大小,依次把关键字小的对象排放到新表 k 所指位置中;当 i 与 j 中有一个已经超出表长时,将另一 个表中的剩余部分照抄到新表中。,i,j,merge(rectype R,rectype R1,int low,int mid,int high)int i=low,j
29、=mid+1,k=low;while(i=mid/将mid后剩余的并入,两路归并算法,一趟归并排序的情形,设R0到Rn-1中 n 个对象已经分为一些长度为 len 的归并项,将这些归并项两两归并,归并成长度为 2len 的归并项,结果放到R1 中。如果n不是2len的整数倍,则一趟归并到最后,可能遇到两种情形:剩下一个长度为len的归并项和另一个长度不足len的归并项,可用merge算法将它们归并成一个长度小于 2len 的归并项。只剩下一个归并项,其长度小于或等于 len,将它直接抄到R1 中。,迭代的归并排序算法,迭代的归并排序算法就是利用两路归并过程进行排序的。其基本思想是:假设初始对象
30、序列有 n 个对象,首先把它看成是 n 个长度为 1 的有序子序列(归并项),先做两两归并,得到 n/2 个长度为 2 的归并项(如果 n 为奇数,则最后一个有序子序列的长度为1);再做两两归并,如此重复,最后得到一个长度为 n 的有序序列。,迭代的归并排序算法,21,25,25*,25*,93,62,72,08,37,16,54,49,21,25,49,62,93,08,72,16,37,54,21,25,25*,49,08,62,72,93,16,37,54,08,08,21,16,25,21,25*,25,49,25*,62,37,72,49,93,54,16,37,54,62,72,9
31、3,len=1,len=2,len=4,len=8,len=16,MergePass(rectype R,rectype R1,int len)int i=0;while(i+2*len-1=n-1)merge(R,R1,i,i+len-1,i+2*len-1);i+=2*len;/循环两两归并 if(i+len=n-1)merge(R,R1,i,i+len-1,n-1);else for(int j=i;j=n-1;j+)R1 j=Rj;,归并排序的主算法 MergeSort(rectype R,int n)/按对象关键字非递减的顺序对表中对象排序 rectype R1n;int len=1
32、;while(len n)MergePass(R,R1,len);len*=2;MergePass(R1,R,len);len*=2;,在迭代的归并排序算法中,函数MergePass()做一趟两路归并排序,要调用merge()函数 n/(2*len)O(n/len)次,函数MergeSort()调用MergePass()正好log2n 次,而每次merge()要执行比较O(len)次,所以算法总的时间复杂度为O(nlog2n)。归并排序占用附加存储较多,需要另外一个与原待排序对象数组同样大小的辅助数组。这是这个算法的缺点。归并排序是一个稳定的排序方法。,基数排序,多关键字排序例 对52张扑克牌
33、按以下次序排序:23A23A23A23A两个关键字:花色()面值(23A)并且“花色”地位高于“面值”多关键字排序方法最高位优先法(MSD):先对最高位关键字k1(如花色)排序,将序列分成若干子序列,每个子序列有相同的k1值;然后让每个子序列对次关键字k2(如面值)排序,又分成若干更小的子序列;依次重复,直至就每个子序列对最低位关键字kd排序;最后将所有子序列依次连接在一起成为一个有序序列,最低位优先法(LSD):从最低位关键字kd起进行排序,然后再对高一位的关键字排序,依次重复,直至对最高位关键字k1排序后,便成为一个有序序列链式基数排序基数排序:借助“分配”和“收集”对单逻辑关键字进行排序的一种方法链式基数排序方法:用链表作存储结构的基数排序设置10个队列,fi和ei分别为第i个队列的头指针和尾指针第一趟分配对最低位关键字(个位)进行,改变记录的指针值,将链表中记录分配至10个链队列中,每个队列记录的关键字的个位相同,第一趟收集是改变所有非空队列的队尾记录的指针域,令其指向下一个非空队列的队头记录,重新将10个队列链成一个链表重复上述两步,进行第二趟、第三趟分配和收集,分别对十位、百位进行,最后得到一个有序序列,例:,各种排序方法的比较,