《数据结构与算法(公共).ppt》由会员分享,可在线阅读,更多相关《数据结构与算法(公共).ppt(46页珍藏版)》请在三一办公上搜索。
1、第一章 数据结构与算法,1.1 算法1.2 数据结构的基本概念1.3 栈及线性链表1.4 树与二叉树1.5 查找技术1.6 排序技术,1.1 算法,算法与数据结构的关系:程序设计主要包括两个方面,一是行为特性的设计,二是结构特性的设计。行为特性的设计一般是指将解决问题过程中的每一个细节准确地加以定义,并将全部的解题过程用某种工具完整地描述出来。这一过程也称为算法的设计。结构特性的设计是指为问题的解决确定合适的数据结构。数据结构与算法之间有着密切的关系。特别是对于数据处理问题,算法的效率通常与数据结构在计算机中的表示有着直接的关系。,考点1 算法的基本概念考试链接:考点1在笔试考试中考核的几率为
2、30%,主要是以填空题的形式出现,分值为2分,此考点为识记内容,读者还应该了解算法中对数据的基本运算。计算机解题的过程实际上是在实施某种算法,这种算法称为计算机算法。算法不等于程序,但程序可以作为算法的一种描述。1算法的基本特征:可行性、确定性、有穷性、拥有足够的情报2算法的基本要素:一个算法由两种基本要素组成:一是对数据对象的运算和操作;二是算法的控制结构。(1)算法中对数据的运算和操作 在一般的计算机系统中,基本的运算和操作有以下4类:算术运算、逻辑运算、关系运算和数据传输。(2)算法的控制结构:算法中各操作之间的执行顺序称为算法的控制结构。描述算法的工具通常有传统流程图、N-S结构化流程
3、图、算法描述语言等。一个算法一般都可以用顺序、选择、循环3种基本控制结构组合而成。,考点2 算法复杂度考试链接:考点2在笔试考试中,是一个经常考查的内容,在笔试考试中出现的几率为70%,主要是以选择的形式出现,分值为2分,此考点为重点识记内容,读者还应该识记算法时间复杂度及空间复杂度的概念。1.算法的时间复杂度 算法的时间复杂度是指执行算法所需要的计算工作量。同一个算法用不同的语言实现,或者用不同的编译程序进行编译,或者在不同的计算机上运行,效率均不同。这表明使用绝对的时间单位衡量算法的效率是不合适的。撇开这些与计算机硬件、软件有关的因素,可以认为一个特定算法“运行工作量”的大小,只依赖于问题
4、的规模(通常用整数n表示),它是问题规模的函数。即 算法的工作量=f(n)其中n是问题的规模,2.算法的空间复杂度 算法的空间复杂度是指执行这个算法所需要的内存空间。一个算法所占用的存储空间包括算法程序所占的空间、输入的初始数据所占的存储空间以及算法执行过程中所需要的额外空间。其中额外空间包括算法程序执行过程中的工作单元以及某种数据结构所需要的附加存储空间。如果额外空间量相对于问题规模来说是常数,则称该算法是原地工作的。在许多实际问题中,为了减少算法所占的存储空间,通常采用压缩存储技术,以便尽量减少不必要的额外空间。,疑难解答:算法的工作量用什么来计算?算法的工作量用算法所执行的基本运算次数来
5、计算,而算法所执行的基本运算次数是问题规模的函数,即算法的工作量=f(n),其中n是问题的规模。,1.2 数据结构的基本概念,考点3 数据结构的定义考试链接:考点3在笔试考试中,是一个经常考查的内容,在笔试考试中出现的几率为70%,主要是以选择的形式出现,分值为2分,此考点为识记内容,读者还应该识记数据的逻辑结构和存储结构的概念。数据结构作为计算机的一门学科,主要研究和讨论以下三个方面的问题:(1)数据集合中各数据元素之间所固有的逻辑关系,即数据的逻辑结构;(2)在对数据元素进行处理时,各数据元素在计算机中的存储关系,即数据的存储结构;(3)对各种数据结构进行的运算。,数据:是对客观事物的符号
6、表示,在计算机科学中是指所有能输入到计算机中并被计算机程序处理的符号的总称。数据元素:在数据处理领域中,每一个需要处理的对象都可以抽象成数据元素,它是数据的基本单位,在计算机程序中通常作为一个整体进行考虑和处理。有时,一个数据元素可由若干个数据项组成,数据项是数据的不可分割的最小单位。如下表中一本书的书目信息为一个数据元素,而书目信息中的每一项(如书名、作者名等)为一个数据项。前后件关系:是数据元素之间的一个基本关系,一般来说,数据元素之间的任何关系都可以用前后件关系来描述。数据结构:是指带有结构的数据元素的集合。所谓结构实际上就是指数据元素之间的前后件关系。,数据的逻辑结构是对数据元素之间的
7、逻辑关系的描述,它可以用一个数据元素的集合和定义在此集合中的若干关系来表示。数据的逻辑结构有两个要素:一是数据元素的集合,通常记为D;二是D上的关系,它反映了数据元素之间的前后件关系,通常记为R。即一个数据结构可以表示成B=(D,R)其中B表示数据结构。为了反映D中各数据元素之间的前后件关系,一般用二元组来表示。例如,假设a和b是D中的两个数据,则二元组(a,b)表示a是b的前件,b是a的后件。这样,在D中的每两个元素之间的关系都可以用这种二元组来表示。数据的逻辑结构在计算机存储空间中的存放形式称为数据的存储结构(也称数据的物理结构)。一个数据结构中的各数据元素在计算机存储空间中的位置关系与逻
8、辑关系有可能是不同的。,由于数据元素在计算机存储空间中的位置关系可能与逻辑关系不同,因此,为了表示存放在计算机存储空间中的各数据元素之间的逻辑关系(即前后件关系),在数据的存储结构中,不仅要存放各数据元素的信息,还需要存放各数据元素之间的前后件关系的信息。一种数据的逻辑结构根据需要可以表示成多种存储结构,常用的存储结构有顺序、链接、索引等存储结构。而采用不同的存储结构,其数据处理的效率是不同的。因此,在进行数据处理时,选择合适的存储结构是很重要的。,考点4 线性结构与非线性结构考试链接:考点4在笔试考试中,虽然说不是考试经常考查的内容,但读者还是对此考点有所了解,在笔试考试中出现的几率为30%
9、,主要是以填空题出现的形式出现,分值为2分,此考点为识记内容。根据数据结构中各数据元素之间前后件关系的复杂程度,一般将数据结构分为两大类型:线性结构与非线性结构。如果一个非空的数据结构满足下列两个条件:(1)有且只有一个根结点(没有前件的结点称为根结点);(2)每一个结点最多有一个前件,也最多有一个后件。则称该数据结构为线性结构。线性结构又称线性表。在一个线性结构中插入或删除任何一个结点后还应是线性结构。如果一个数据结构不是线性结构,则称之为非线性结构。,疑难解答:空的数据结构是线性结构还是非线性结构?线性结构与非线性结构都可以是空的数据结构。一个空的数据结构究竟是属于线性结构还是属于非线性结
10、构,这要根据具体情况来确定。如果对该数据结构的算法是按线性结构的规则来处理的,则属于线性结构;否则属于非线性结构。,线性表的基本概念 线性表是由n(n=0)个数据元素a1,a2,an组成的一个有限序列。表中的每一个数据元素,除了第一个外,有且只有一个前件,除了最后一个外,有且只有一个后件。即线性表或是一个空表,或可以表示为(a1,a2,ai,an)其中ai(i=1,2,n)是属于数据对象的元素,通常也称其为线性表中的一个结点。显然,线性表是一种线性结构。数据元素在线性表中的位置只取决于它们自己的序号,即数据元素之间的相对位置是线性的。非空线性表有如下一些结构特征:(1)有且只有一个根结点a1,
11、它无前件;(2)有且只有一个终端结点an,它无后件;(3)除根结点与终端结点外,其他所有结点有且只有一个前件,也有且只有一个后件。线性表中结点的个数n称为线性表的长度。当n=0时,称为空表。,线性表的顺序存储结构 线性表的顺序存储结构具有以下两个基本特点:(1)所有元素所占的存储空间是连续的;(2)各数据元素在存储空间中是按逻辑顺序依次存放的。由此可以看出,在线性表的顺序存储结构中,其前后件两个元素在存储空间中是紧邻的,且前件元素一定存储在后件元素的前面。顺序表的插入运算 设长度为n的线性表为(a1,a2,ai,an),现要在线性表的第i个元素ai之前插入一个新元素b,插入后得到长度为n+1的
12、线性表。一般情况下,要在第i(1=i=n)个元素之前插入一个新元素,首先要从最后一个元素开始,直到第i个元素,其间共n-i+1个元素依次向后移动一个位置,移动结束后,第i个位置就被空出,然后将新元素插入到第i项。插入结束后,线性表的长度就增加了1。在平均情况下,在线性表中插入一个新元素,需要移动表中一半的元素。,顺序表的删除运算 设长度为n的线性表为(a1,a2,ai,an),现要删除第i个元素ai,删除后得到长度为n-1的线性表。一般情况下,要删除第i(1=i=n)个元素,则要从第i+1个元素开始,直到第n个元素,其间共n-i个元素依次向前移动一个位置。删除结束后,线性表的长度就减小了1。在
13、平均情况下,在线性表中删除一个新元素,需要移动表中一半的元素。,1.3 栈、队列及线性链表,考点5 栈、队列、线性链表及其基本运算考试链接:考点5在笔试考试中,是一个必考的内容,在笔试考试中出现的几率为100%,主要是以选择的形式出现,分值为2分,此考点为重点掌握内容。1栈的基本概念 栈是限定只在一端进行插入与删除的线性表,通常称插入、删除的这一端为栈顶,另一端为栈底。当表中没有元素时称为空栈。栈顶元素总是后被插入的元素,从而也是最先被删除的元素;栈底元素总是最先被插入的元素,从而也是最后才能被删除的元素。栈是按照“先进后出”或“后进先出”的原则组织数据的。因此,栈也被称为“先进后出”表或“后
14、进先出”表。由此可以看出,栈具有记忆作用。通常用指针top来指示栈顶的位置,用指针bottom指向栈底。往栈中插入一个元素称为入栈运算,从栈中删除一个元素(即删除栈顶元素)称为退栈运算。栈顶指针top动态反映了栈中元素的变化情况。,2栈的顺序存储及其运算 用一维数组S(1m)作为栈的顺序存储空间,其中m为最大容量。在栈的顺序存储空间S(1m)中,S(bottom)为栈底元素(在栈非空的情况下),S(top)为栈顶元素。top=0表示栈空;top=m表示栈满。栈的基本运算有三种:入栈、退栈与读栈顶元素。(1)入栈运算:入栈运算是指在栈顶位置插入一个新元素。首先将栈顶指针加1(即top加1),然后
15、将新元素插入到栈顶指针指向的位置。当栈顶指针已经指向存储空间的最后一个位置时,说明栈空间已满,不可能再进行入栈操作。这种情况称为栈上溢错误。(2)退栈运算:退栈是指取出栈顶元素并赋给一个指定的变量。首先将栈顶元素(栈顶指针指向的元素)赋给一个指定的变量,然后将栈顶指针减1(即top减1)。当栈顶指针为0时,说明栈空,不可进行退栈操作。这种情况称为栈的下溢错误。(3)读栈顶元素:读栈顶元素是指将栈顶元素赋给一个指定的变量。这个运算不删除栈顶元素,只是将它赋给一个变量,因此栈顶指针不会改变。当栈顶指针为0时,说明栈空,读不到栈顶元素。,注:栈支持子程序调用。在主程序调用子函数时要首先保存主程序当前
16、的状态,然后转去执行子程序,最终把子程序的执行结果返回到主程序中调用子程序的位置,继续向下执行,这种调用符合栈的特点(只能在一端进行插入与删除)。,3.队列的基本概念 队列是指允许在一端进行插入而在另一端进行删除的线性表。允许插入的一端称为队尾,通常用一个称为尾指针(rear)的指针指向队尾元素,即尾指针总是指向最后被插入的元素;允许删除的一端称为排头(也称为队头),通常用一个队头指针(front)指向队头元素的前一个位置。队列又称为“先进先出”或“后进后出”的线性表。在队列中,队尾指针rear和队头指针front共同反映了队列中元素动态变化的情况。往队列的队尾插入一个元素称为入队运算,从队列
17、的队头删除一个元素称为退队运算。4.循环队列及其运算 所谓循环队列,就是将队列存储空间的最后一个位置绕到第一个位置,形成逻辑上的环状空间,供队列循环使用。在循环队列结构中,当存储空间的最后一个位置已被使用而再要进行入队运算时,只要存储空间的第一个位置空闲,便可将元素加入到第一个位置,即将存储空间的第一个位置作为队尾。,循环队列的初始状态为空,即rear=front=m 每进行一次入队运算,队尾指针加1;当队尾指针rear=m+1时,则置rear=1 每进行一次退队运算,队头指针加1;当队头指针front=m+1时,则置front=1注:随着插入、删除元素的进行,队头指针可以大于队尾指针也可以小
18、于队尾指针 在实际使用循环队列时,为了能区分队列满还是队列空,通常还需增加一个标志s,s值的定义如下:s=0 表示队列空s=1 表示队列非空由此可以得出队列空与队列满的条件如下:(1)队列空的条件为s=0;(2)队列满的条件为(s=1)且(front=rear);,循环队列入队与退队的算法如下:假设循环队列的初始状态为空,即s=0,且front=rear=m入队运算 入队运算有两个基本操作:首先将队尾指针加1(即rear=rear+1),并当rear=m+1时置rear=1;然后将新元素插入到队尾指针指向的位置。当循环队列非空(s=1)且队尾指针等于队头指针时,说明循环队列已满,不能进行入队运
19、算。这种情况称为“上溢”。退队运算 退队运算有两个基本操作:首先将队头指针加1(即front=front+1),并当front=m+1时置front=1;然后将队头指针指向的元素赋给指定的变量。当循环队列为空(s=0)时,不能进行退队运算。这种情况称为“下溢”。,考点6 线性链表的基本概念考试链接:考点6在笔试考试中出现的几率为30%,主要是以选择的形式出现,分值为2分,此考点为识记内容。重点识记结点的组成。两种不同的存储结构:顺序存储结构和链式存储结构。在链式存储方式中,要求每个结点由两部分组成:一部分用于存放数据元素值,称为数据域,另一部分用于存放指针,称为指针域。其中指针用于指向该结点的
20、前一个或后一个结点(即前件或后件)。链式存储方式既可用于表示线性结构,也可用于表示非线性结构。(1)线性链表 线性表的链式存储结构称为线性链表。在某些应用中,对线性链表中的每个结点设置两个指针,一个称为左指针,用以指向其前件结点;另一个称为右指针,用以指向其后件结点。这样的表称为双向链表。(2)带链的栈 栈也是线性表,也可以采用链式存储结构。带链的栈可以用来收集计算机存储空间中所有空闲的存储结点,这种带链的栈称为可利用栈。,在链式结构中,存储空间位置关系与逻辑关系是什么?在链式存储结构中,存储数据结构的存储空间可以不连续,各数据结点的存储顺序与数据元素之间的逻辑关系可以不一致,而数据元素之间的
21、逻辑关系是由指针域来确定的。,2.线性链表及其基本运算 指向线性表中第一个结点的指针HEAD称为头指针,当HEAD=NULL(或0)时称为空表。(1)在线性链表中查找指定元素 在非空线性链表中寻找包含指定元素值x的前一个结点p的方法如下:从头指针指向的结点开始往后沿指针进行扫描,直到后面已没有结点或下一个结点的数据域为x为止。因此,由这种方法找到的结点p有两种可能:当线性链表中存在包含元素x的结点时,则找到的p为第一次遇到的包含元素x的前一个结点序号;当线性链表中不存在包含元素x的结点时,则找到的p为线性链表中的最后一个结点序号。(2)线性链表的插入 线性链表的插入是指在链式存储结构下的线性表
22、中插入一个新元素。首先给该元素分配一个新结点,以便用于存储该元素的值,然后将存放新元素值的结点链接到线性链表中指定的位置。(3)线性链表的删除 线性链表的删除是指在链式存储结构下的线性表中删除包含指定元素的结点。首先在线性链表中找到这个结点,然后修改前一个结点的指针域即可。,3.循环链表及其基本运算 循环链表的结构与一般的单链表相比,具有以下两个特点:(1)在循环链表中增加了一个表头结点,其数据域为任意或者根据需要来设置,指针域指向线性表的第一个元素的结点,循环链表的头指针指向表头结点。(2)循环链表中最后一个结点的指针域不是空,而是指向表头结点。即在循环链表中,所有结点的指针构成了一个环状链
23、。在实际应用中,循环链表主要有以下两个方面的优点:(1)在循环链表中,只要指出表中任何一个结点的位置,就可以从它出发访问到表中其他所有的结点。而线性链表做不到这一点。(2)由于在循环链表中设置了一个表头结点,因此,在任何情况下,循环链表中至少有一个结点存在。循环链表插入与删除的方法与线性链表基本相同,由循环链表的特点可以看出,在对循环链表进行插入与删除的过程中,实现了空表与非空表的运算统一。,考点7 树与二叉树及其基本性质考试链接:考点7在笔试考试中,是一个必考的内容,在笔试考试中出现的几率为100%,主要是以选择的形式出现,有时也有出现在填空题中,分值为2分,此考点为重点掌握内容。重点识记树
24、及二叉树的性质。1、树的基本概念 树(tree)是一种简单的非线性结构。在树结构中,每一个结点只有一个前件,称为父结点,没有前件的结点只有一个,称为树的根结点。每一个结点可以有多个后件,它们称为该结点的子结点。没有后件的结点称为叶子结点。在树结构中,一个结点所拥有的后件个数称为该结点的度。叶子结点的度为0。在树中,所有结点中的最大的度称为树的度。在树结构中,一般按如下原则分层:(1)根结点在第1层(2)同一层上所有结点的所有子结点在下一层(3)树的最大层次称为树的深度(4)在树中,以某结点的一个子结点为根构成的树称为该结点的一颗子树(5)在树中,叶子结点没有子树,1.4 树与二叉树,2、二叉树
25、及其基本性质(1)二叉树的定义二叉树具有以下两个特点:非空二叉树只有一个根结点;每一个结点最多有两棵子树,且分别称为该结点的左子树和右子树。由以上特点可以看出,在二叉树中,每一个结点的度最大为2,即所有子树(左子树或右子树)也均为二叉树,而树结构中的每一个结点的度可以是任意的。另外,二叉树中的每个结点的子树被明显地分为左子树和右子树。在二叉树中,一个结点可以只有左子树而没有右子树,也可以只有右子树而没有左子树。当一个结点既没有左子树也没有右子树时,该结点即为叶子结点。(2)二叉树的基本性质性质1:在二叉树的第k层上,最多有2k-1(k1)个结点;性质2:深度为m的二叉树最多有2m-1个结点;性
26、质3:在任意一棵二叉树中,度为0的结点(即叶子结点)总是比度为2的结点多一个。性质4:具有n个结点的二叉树,其深度至少为log2n+1,其中log2n表示取log2n的整数部分。,3、满二叉树与完全二叉树满二叉树是指这样的一种二叉树:除最后一层外,每一层上的所有结点都有两个子结点。在满二叉树中,每一层上的结点数都达到最大值,即在满二叉树的第k层上有2k-1个结点,且深度为m的满二叉树有2m1个结点。完全二叉树是指这样的二叉树:除最后一层外,每一层上的结点数均达到最大值;在最后一层上只缺少右边的若干结点。对于完全二叉树来说叶子结点只可能在层次最大的两层上出现:对于任何一个结点,若其右分支下的子孙
27、结点的最大层次为p,则其左分支下的子孙结点的最大层次或为p,或为p+1。满二叉树也是完全二叉树,而完全二叉树一般不是满二叉树完全二叉树还具有以下两个性质:性质5:具有n个结点的完全二叉树的深度为log2n+1。性质6:设完全二叉树共有n个结点。如果从根结点开始,按层次(每一层从左到右)用自然数1,2,n给结点进行编号,则对于编号为k(k=1,2,n)的结点有以下结论:若k=1,则该结点为根结点,它没有父结点;若k1,则该结点的父结点编号为INT(k/2)。若2kn,则编号为k的结点的左子结点编号为2k;否则该结点无左子结点(显然也没有右子结点)。若2k+1n,则编号为k的结点的右子结点编号为2
28、k+1;否则该结点无右子结点。,4.二叉树的存储结构 在计算机中,二叉树通常采用链式存储结构。与线性链表类似,用于存储二叉树中各元素的存储结点也由两部分组成:数据域与指针域。但在二叉树中,由于每一个元素可以有两个后件(即两个子结点),因此,用于存储二叉树的存储结点的指针域有两个:一个用于指向该结点的左子结点的存储地址,称为左指针域;另一个用于指向该结点的右子结点的存储地址,称为右指针域。由于二叉树的存储结构中每一个存储结点有两个指针域,因此,二叉树的链式存储结构也称为二叉链表。对于满二叉树与完全二叉树来说,根据完全二叉树的性质6,可以按层序进行顺序存储,这样,不仅节省了存储空间,又能方便地确定
29、每一个结点的父结点与左右子结点的位置。但顺序存储结构对于一般的二叉树不适用。,考点8 二叉树的遍历考试链接:考点8在笔试考试中考核几率为30%,分值为2分,读者应该熟练掌握各种遍历的具体算法,能由两种遍历的结果推导另一种遍历的结果。二叉树的遍历是指不重复地访问二叉树中的所有结点。在遍历二叉树的过程中,一般先遍历左子树,再遍历右子树。在先左后右的原则下,根据访问根结点的次序,二叉树的遍历分为三类:前序遍历、中序遍历和后序遍历。(1)前序遍历:先访问根结点、然后遍历左子树,最后遍历右子树;并且,在遍历左、右子树时,仍然先访问根结点,然后遍历左子树,最后遍历右子树。(2)中序遍历:先遍历左子树、然后
30、访问根结点,最后遍历右子树;并且,在遍历左、右子树时,仍然先遍历左子树,然后访问根结点,最后遍历右子树。(3)后序遍历:先遍历左子树、然后遍历右子树,最后访问根结点;并且,在遍历左、右子树时,仍然先遍历左子树,然后遍历右子树,最后访问根结点。,树与二叉树的不同之处是什么?在二叉树中,每一个结点的度最大为2,即所有子树(左子树或右子树)也均为二叉树,而树结构中的每一个结点的度可以是任意的。,A B CD E F前序遍历结果为:ABDECF中序遍历结果为:DBEAFC后序遍历结果为:DEBFCA,1.5 查找技术,考点9 顺序查找考试链接:考点9在笔试考试中考核几率在30%,一般出现选择题中,分值
31、为2分,读者应该具体掌握顺序查找的算法。顺序查找是指在一个给定的线性表中查找某个指定的元素。基本方法是从线性表的第一个元素开始,依次将线性表中的元素与被查找的元素相比较,若相等则表示查找成功;若线性表中所有的元素都与被查找元素进行了比较但都不相等,则表示查找失败。在平均情况下,利用顺序查找法在线性表中查找一个元素,大约要与线性表中一半的元素进行比较。在下列两种情况下只能采用顺序查找:(1)如果线性表为无序表,则不管是顺序存储结构还是链式存储结构,只能用顺序查找。(2)即使是有序线性表,如果采用链式存储结构,也只能用顺序查找。,考点10 二分法查找考试链接:考点10在笔试考试中考核几率为30%,
32、一般出现填空题中,分值为2分,考核比较多查找的比较次数,读者应该具体掌握二分查找法的算法。二分法只适用于顺序存储的有序表。在此所说的有序表是指线性表中的元素按值非递减排列(即从小到大,但允许相邻元素值相等)。其方法如下:设有序线性表的长度为n,被查找的元素为i,(1)将i与线性表的中间项进行比较;(2)若i与中间项的值相等,则查找成功;(3)若i小于中间项,则在线性表的前半部分以相同的方法查找;(4)若i大于中间项,则在线性表的后半部分以相同的方法查找。,这个过程一直进行到查找成功或子表长度为0(说明线性表中没有这个元素)为止。对于长度为n的有序线性表,在最坏情况下,二分查找只需要比较log2
33、n次,而顺序查找需要比较n次。,1.6 排序技术,考点11 各种排序法考试链接:考点11属于比较难的内容,一般以选择题的形式考查,考核几率为30%,分值约为2分,读者应该熟练掌握几种排序算法的基本过程。1.交换类排序所谓交换类排序是指借助数据元素之间的互相交换进行排序的一种方法。冒泡排序法和快速排序法都属于交换类排序法。(1)冒泡排序法首先,从表头开始往后扫描线性表,逐次比较相邻两个元素的大小,若前面的元素大于后面的元素,则将它们互换,不断地将两个相邻元素中的大者往后移动,最后最大者到了线性表的最后。然后,从后到前扫描剩下的线性表,逐次比较相邻两个元素的大小,若后面的元素小于前面的元素,则将它
34、们互换,不断地将两个相邻元素中的小者往前移动,最后最小者到了线性表的最前面。对剩下的线性表重复上述过程,直到剩下的线性表变空为止,此时已经排好序。在最坏的情况下,冒泡排序需要比较次数为n(n1)/2。,(2)快速排序法 它的基本思想是:任取待排序序列中的某个元素作为基准(一般取第一个元素),通过一趟排序,将待排元素分为左右两个子序列,左子序列元素的排序码均小于或等于基准元素的排序码,右子序列的排序码则大于基准元素的排序码,然后分别对两个子序列继续进行排序,直至所有子表为空为止,此时的线性表就变成了有序表。,冒泡排序和快速排序的平均执行时间分别是多少?冒泡排序法的平均执行时间是O(n2),而快速
35、排序法的平均执行时间是O(nlog2n)。,2.插入类排序(1)简单插入排序 所谓插入类排序,是指将无序序列中的各元素依次插入到已经有序的线性表中。假设线性表中前j-1个元素已经有序,现在要将线性表中第j个元素插入到前面的有序子表中,插入过程如下:首先将第j个元素放到一个变量T中,然后从有序子表的最后一个元素(即线性表中第j-1个元素)开始,往前逐个与T进行比较,将大于T的元素均依次向后移动一个位置,直到发现一个元素不大于T为止,此时就将T(即原线性表中的第j个元素)插入到刚移出的空位置上,有序子表的长度就变为j了。在最坏情况下,简单插入排序需要比较n(n-1)/2次。(2)希尔排序 在最坏情
36、况下,希尔排序所需要的比较次数为O(n1.5),3.选择类排序(1)简单选择排序 基本思想如下:扫描整个线性表,从中选出最小的元素,将它交换到表的最前面(这是它应有的位置),然后对剩下的子表采用同样的方法,直到子表空为止。对于长度为n的序列,选择排序需要扫描n-1遍,每一遍扫描均从剩下的子表中选出最小的元素,然后将该最小的元素与子表中的第一个元素进行交换。简单选择排序在最坏情况下需要比较n(n-1)/2次(2)堆排序 在最坏情况下,堆排序需要比较的次数为O(nlog2n),1.7 例题详解,【例1】算法的时间复杂度取决于_。(考点2)A)问题的规模B)待处理的数据的初态C)问题的难度D)A)和
37、B)解析:算法的时间复杂度不仅与问题的规模有关,在同一个问题规模下,而且与输入数据有关。即与输入数据所有的可能取值范围、输入各种数据或数据集的概率有关。答案:D),【例2】在数据结构中,从逻辑上可以把数据结构分成_。(考点3)A)内部结构和外部结构B)线性结构和非线性结构C)紧凑结构和非紧凑结构D)动态结构和静态结构解析:逻辑结构反映数据元素之间的逻辑关系,线性结构表示数据元素之间为一对一的关系,非线性结构表示数据元素之间为一对多或者多对一的关系,所以答案为B)。答案:B),【例3】以下_不是栈的基本运算。(考点5)A)判断栈是否为素空B)将栈置为空栈C)删除栈顶元素D)删除栈底元素解析:栈的
38、基本运算有:入栈,出栈(删除栈顶元素),初始化、置空、判断栈是否为空或满、提取栈顶元素等,对栈的操作都是在栈顶进行的。答案:D),【例4】链表不具备的特点是_。(考点6)A)可随机访问任意一个结点B)插入和删除不需要移动任何元素C)不必事先估计存储空间D)所需空间与其长度成正比解析:顺序表可以随机访问任意一个结点,而链表必须从第一个数据结点出发,逐一查找每个结点。所以答案为A)。答案:A),【例5】已知某二叉树的后序遍历序列是DACBE,中序遍历序列是DEBAC,则它的前序遍历序列是_。(考点8)A)ACBEDB)DEABCC)DECABD)EDBCA解析:后序遍历的顺序是左子树右子树根结点;
39、中序遍历顺序是左子树根结点右子树;前序遍历顺序是根结点左子树右子树。根据各种遍历算法,不难得出前序遍历序列是EDBCA。所以答案为D)。答案:D),【例6】设有一个已按各元素的值排好序的线性表(长度大于2),对给定的值k,分别用顺序查找法和二分查找法查找一个与k相等的元素,比较的次数分别是s和b,在查找不成功的情况下,s和b的关系是_。(考点9)A)s=bB)sbC)slog2n。答案:B),【例7】在快速排序过程中,每次划分,将被划分的表(或子表)分成左、右两个子表,考虑这两个子表,下列结论一定正确的是_。(考点11)A)左、右两个子表都已各自排好序B)左边子表中的元素都不大于右边子表中的元
40、素C)左边子表的长度小于右边子表的长度D)左、右两个子表中元素的平均值相等解析:快速排序基本思想是:任取待排序表中的某个元素作为基准(一般取第一个元素),通过一趟排序,将待排元素分为左右两个子表,左子表元素的排序码均小于或等于基准元素的排序码,右子表的排序码则大于基准元素的排序码,然后分别对两个子表继续进行排序,直至整个表有序。答案:B),【例8】问题处理方案的正确而完整的描述称为_。(考点1)解析:计算机解题的过程实际上是在实施某种算法,这种算法称为计算机算法。答案:算法,【例9】一个空的数据结构是按线性结构处理的,则属于_。(考点4)解析:一个空的数据结构是线性结构或是非线性结构,要根据具体情况而定。如果对数据结构的运算是按线性结构来处理的,则属于线性结构,否则属于非线性结构。答案:线性结构,【例10】设树的度为,其中度为、和的结点的个数分别为、,则中叶子结点的个数为_。(考点7)解析:根据树的性质:树的结点数等于所有结点的度与对应的结点个数乘积之和加。因此树的结点数为16。叶子结点数目等于树结点总数减去度不为的结点数之和,即16()。答案:8,【例11】二分法查找的存储结构仅限于_且是有序的。(考点10)解析:二分查找,也称折半查找,它是一种高效率的查找方法。但二分查找有条件限制:要求表必须用顺序存储结构,且表中元素必须按关键字有序(升序或降序均可)。答案:顺序存储结构,