《数据的组织结构与算法1汇总课件.ppt》由会员分享,可在线阅读,更多相关《数据的组织结构与算法1汇总课件.ppt(49页珍藏版)》请在三一办公上搜索。
1、1,第六章 数据的组织结构与算法,6.1 数据结构的基本概念6.2 常用的几种数据结构6.3 算法6.4 程序设计方法,2,6.1数据结构的基本概念,6.1.1 数值计算与非数值计算数据是描述客观事物的数值、字符以及能输入机器且能被处理的各种符号集合。换句话说,数据对客观事物采用计算机能够识别、存贮和处理形式所进行的描述。简言之,数据就是计算机化的信息。数学模型有定量模型和定性模型两类之分,定量模型指的是可以用数值方程表示的一类计算模型,而定性模型则是指非数值性的数据结构,如表、树和图等及其运算。,3,数据结构(Data Structure)问题起源于程序设计的发展。第一个8008芯片只有4K
2、的内存,微软的最初成立就是为这个芯片的机器编写BASIC语言,优化在每一处都非常重要。逐渐地,人们注意了数据表示与操作的结构化,把一些确实能够有效解决问题的数据表示和算法总结出来,如表、栈、队、树、图(稍后会介绍这些术语)等被单独抽出研究,而这些方法便形成一门学问,这就是“数据结构”这门学科的来源。,6.1.2 数据结构的起源,4,数据结构有逻辑上的数据结构和物理上的数据结构之分。逻辑上的数据结构反映成分数据之间的逻辑关系。物理上的数据结构反映成分数据在计算机内部的存储安排。,6.1.3 对数据结构的理解,5,1.表示 对象/实体及其关系在计算机中的表示。只有对象及其相互关系已存储(表示)在计
3、算机中,才能被进一步处理;2.操作:对对象/实体进行处理、访问。数据结构的一般定义:相互之间存在着一定关系的数据元素的集合及定义在其上的操作(运算)称为数据结构。,6,1.插入:在数据结构中的指定位置增添新的数据元素2.删除:删去数据结构中指定的数据元素。3.查找:在数据结构中寻找某个特定要求的数据元素。4.排序:(在线性结构中)重新安排数据元素之间的逻辑顺序关系,使之按某个关键字值由小到大或由大到小的次序排列。5.遍历:按某一次序访问数据结构中的每一个数据元素。,6.1.4 对数据结构中数据元素的操作,7,例6.1 解一元二次方程ax2+bx+c=0.利用计算机解此方程,第一个问题就是如何在
4、计算机中表示该方程。分析该方程,可知决定方程的是方程的三个系数值:a、b、c,而它们的次序表示它们分别属于那一项,其他符号是为增加可读性而引入的,因此,可用这三个系数的线性排列在计算机中表示该方程。例如:3x2-x+1=0表示为(3,-1,1)x2-3=0 表示为(1,0,-3)在数据结构中,将若干个数线性排列的数(元素)称为线性表,因此,一元二次方程ax2+bx+c=0就在计算机中表示为线性表(a,b,c)。解方程实质上是对线性表(a,b,c)进行操作。,6.1.5 数据结构能解决什么问题,8,定义变量X和一个线性表,如数组int S3;S2,S1,S0可以分别存放三个系数值,输入S2,S1
5、,S0三个系数值,输入任意一个值X,开始,S2*X*X+S1*X+S01E-5?,输出X,结束,YES,NO,9,例6-2 电话号码查询系统 设有一个电话号码薄,它记录了N个人的名字和其相应的电话号码,假定按如下形式安排:(a1,b1)(a2,b2)(ai,bi)其中ai,bi(i=1,2n)分别表示某人的名字和对应的电话号码。要求设计一个算法,当给定任何一个人的名字时,该算法能够打印出此人的电话号码,如果该电话簿中根本就没有这个人,则该算法也能够报告没有这个人的标志。假定名字和其电话号码逻辑上已安排成N元向量的形式,它的每个元素是一个数对(ai,bi),1in。,10,例6-3 家族成员的族
6、谱表示 一个家族的族谱就构成了一个层次结构,在数据结构中,称为树。图6-2给出了这种族谱关系。,11,一般用示意图表示数据结构。用小圆圈代表数据元素,用小圆圈之间的连线代表小圆圈对应的数据元素具有的关系,如果强调关系的方向性,可用带箭头的线段表示关系。具体地讲,若d1和d2表示两个数据元素,它们具有关系d1,d2,则表示为如图6-3所示的结构。图中表示的只是一个抽象关系,不代表具体意义。对于具体的应用,也可以表示家族关系中的父子关系。例如,d1,d2可代表d1是d2的父亲。,6.1.6 数据结构的图示,12,6.2 常用的几种数据结构,根据数据元素之间的关系的不同,将数据结构的逻辑结构分为集合
7、结构、线性结构、树状结构和图结构(图6-4)。,13,集合:数据元素间除了“同属于一个集合”外,别无其它关系。线性结构:数据元素间存在一个对一个的关系。树形结构:数据元素间存在一个对多个的关系。图或网状结构:数据元素间存在多个对多个的关系。,6.2 常用的几种数据结构,14,1.栈(stack)栈是只能在某一端插入和删除的特殊线性表。进行删除和插入的一端称栈顶,另一堆称栈底。插入一般称为进栈(Push),删除则称为出栈(Pop)。栈也称为后进先出表(LIFO:Last In,First Out)。操作系统中的中断调用及返回就是采用栈结构,6.2.1 线性结构,15,队列是限定在一端进行插入,另
8、一端进行删除和特殊线性表。通常把队列的删除和插入分别称为出队和入队。允许出队的一端称为队头,允许入队的一端称为队尾。所有需要进队的数据项,只能从队尾进入,队列中的数据项只能从队头离去。由于总是先入队的元素先出队(先排队的人先买完东西),这种表也称为先进先表(FIFO:First In,First Out)表。,2.队列,16,1.链表是指用一组任意的存储单元来依次存放线性表的数据元素。2.在存储每个结点值的同时,必须存储指示其后继(或前趋)结点的地址(或位置)信息,这个信息称为指针(pointer)或链(link)。如果链表的每一个结点只有一个指针域,则这种链表称为单链表结点结构,如图6-9(
9、a)所示;如果链表的每一个结点有两个指针域,则这种链表称为双链表结点结构。一个指针域指向其前趋结点,一个指针域向其后继结点。如图6-9(b)所示。,3.链表,17,例6.4 单循环链表的应用,单循环链表的一个典型例子是约瑟夫环(Joseph Circle),其描述如下:编号为1,2,.,n的n个人按顺时针方向围坐一圈,每人持有一个密码(正整数)。现在给定一个随机数m0,从编号为1的人开始,按顺时针方向1开始顺序报数,报到m时停止。报m的人出圈,同时留下他的密码作为新的m值,从他在顺时针方向上的下一个人开始,重新从1开始报数,如此下去,直至所有的人出列为止。,18,当n和m较大时,用人工求解约瑟
10、夫环问题是相当繁琐的。采用单循环链表就容易解决。其基本思路是:人围成一圈,把一人看成一个结点,人之间的关系采用链接方式,即每一结点有一个前趋结点和一个后继结点,每一个结点有一个指针指向下一个结点,最后一个结点指针指向第一个结点。这就是单循环链的数据结构。当人出列时,将结点的前趋结点指针指向结点的后继结点指针,即把结点驱出循环链。,19,1树的定义 树是由一个或多个结点组成的有限集合,如图6-12所示。,6.2.2 树结构,20,必有一个特定的称为根(ROOT)的结点,根的每个分支称为子树(sub-tree),子树也是一棵树树中的每一个结点都可以不止一个直接后继,结点的后继结点称为该结点的“子结
11、点”(Children)除根结点外的所有结点有且只有一个直接前趋,结点的前趋结点称为该结点的“父结点”(Parent)同一父结点的子结点称为“兄弟”(Sibling)结点下不再有分支的称为树叶(leaf),或者叶子结点,树结构的特点,21,二叉树的特点:树中的每个结点最多只有两棵子树,即树中任何结点的度数不得大于。二叉树的子树有左右之分,称为左子树和右子树。而且子树的左右次序是重要的,即使在只有一棵子树的情况下,也应分清楚。例如图6-13是两棵不同的二叉树。,2二叉树,22,所谓遍历二叉树,就是按一定的规则和顺序走遍二叉树的所有结点,使每一个结点都被访问一次,而且只被访问一次。二叉树的遍历可分
12、为先序遍历中序遍历后序遍历,3二叉树的遍历,23,1先序遍历递归算法定义:若二叉树非空,则依次执行操作:(1)访问根结点;(2)遍历左子树;(3)遍历右子树。ABDGECF2.中序遍历递归算法定义:若二叉树非空,则依次执行操作:(1)遍历左子树;(2)访问根结点;(3)遍历右子树。GDBEACF3后序遍历递归算法定义:若二叉树非空,则依次执行操作:(1)遍历左子树;(2)遍历右子树;(3)访问根结点。GDEBFCA,24,一个图由有限的顶点(Vertices)和边(Edge)组成,所以可形式化地用G(V,E)代表一个图。图中的结点称为顶点,顶点之间的连线代表边。,6.2.3 图结构,25,图(
13、Graph)是由非空的顶点集合和一个描述顶点之间关系边(或者弧)的集合组成。其形式化定义为:G(V,E)Vvi|vidataobjectE(vi,vj)|vi,vj V P(vi,vj)其中,G表示一个图,V是图G中顶点的集合,E是图G中边的集合,集合E中P(vi,vj)表示顶点vi和顶点vj之间有一条直接连线,即偶对(vi,vj)表示一条边。,6.2.3 图结构,26,下图(无向图G1)给出了一个图的示例,在该图中:集合Vv1,v2,v3,v4;集合E(v1,v3),(v1,v4),(v2,v3),(v2,v4),(V3,V4),6.2.3 图结构,27,如果数据结构中,数据元素之间不考虑关
14、系问题(无前趋/后继之分),则称这种结构为集合。在集合中,各元素是“平等”的,它们的共同关系是:都属于同一个集合。,6.2.4 集合,28,6.3 算法,6.3.1 算法的特性算法是对问题求解过程的一种描述,是为解决一个或一类问题给出的一个确定的、有限长的操作序列。1.有穷性2.确定性3.可行性4.有输入5.有输出,29,算法的五个特性,(1)有穷性:对任何合法的输入值,一个算法必须总是在执行有穷步之后结束,且每一步都可在有穷时间内完成;(2)确定性:算法中每一条指令必须有确切的含义,不会产生二义性,对于相同的输入只能得出相同的输出。(3)可行性:即算法中描述的操作都可以通过已经实现的基本运算
15、执行有限次来实现的。(4)输入:一个算法有0个或多个输入,这些输入取自于某个特定的数据对象的集合,它可以使用输入语句从外部提供,也可以在算法内通过赋初值给定。(5)输出:一个算法有一个或多个的输出,这些输出是同输入有着某些特定关系的量。,30,在设计算法时,通常应考虑以下原则:首先设计的算法必须是“正确的”其次应有很好的“可读性”,还必须具有“健壮性”最后还应考虑所设计算法的复杂性,即有“高效率与低存储量”。,6.3.2 什么是“好”的算法,31,算法的正确性,所谓算法的正确性,也称可靠性或有效性,是指:程序不含语法错误。程序对于几组输入的数据能够得出满足规格说明要求的结果。程序对于精心选择的
16、典型、苛刻而带有刁难性的几组输入数据能够得出满足规格说明要求的结果。程序对于一切合法的输入数据都能产生满足规格说明要求的结果。,32,在算法是正确的前提下,算法的可读性是摆在第一位的。可读性好有助于人们对算法的理解,难懂的程序易隐藏较多错误,难以调试和修改。算法的效率指的是算法执行时计算机资源的消耗,它包括运行时间代价和存储空间代价。算法的健壮性指的是,算法应对非法输入的数据做出恰当反映或进行相应处理。它强调的是,如果输入非法数据时,算法应能加以识别并做出处理,而不是产生误动作或陷入瘫痪。,33,算法的复杂性是算法运行所需要的计算机资源的量。算法的复杂性是算法效率的度量,是评价算法优劣的重要依
17、据。算法的复杂性有时间复杂性和空间复杂性之分。需要的时间资源的量,即算法的运行速度,称作时间复杂性。需要的空间(即存储器)资源的量称作空间复杂性。,6.3.3 算法复杂性,34,1自然语言 自然语言是人们日常所用的语言,如汉语、英语、德语等。例如,求3个数中最大者的问题,可以描述为:比较前两个数。将中较大的数与第三个数进行比较。步骤中较大的数即为所求。,6.3.4 算法的表示,35,2流程图 流程图是描述算法的常用工具。它采用美国国家标准化协会ANSI(American National Standard Institute)规定的一组图形符号来表示算法,36,3伪代码 伪代码是用介于自然语言
18、和计算机语言之间的文字和符号来描述算法的工具。它不用图形符号,因此书写方便格式紧凑,易于理解,便于向计算机程序设计语言过渡。例:求两个数的较大者,用伪代码描述算法如下:Find the bigger Input:two number s:a,b 1.if(the first number a is greater than or equal to the second number b)then 1.1 return a else 1.2 return b end if end,37,4计算机程序设计语言 一般而言,计算机程序设计语言描述的算法是清晰的、简明的,最终也能由计算机处理的,然而也不
19、是完善无缺。它需要设计者用特定程序设计语言编写的算法,限制了与他人的交流;容易陷入描述计算步骤的细节而忽视算法的本质。,38,6.4 程序设计方法,6.4.1 计算机程序的性质计算机程序包含两方面的内容:对象及对象之间关系(数据结构);描述对这些对象进行处理的加工规则(算法)。,39,目的性 程序有明确的目的,程序运行时能完成赋予它的功能。分步性 程序为完成其复杂的功能,由一系列计算机可执行的步骤组成。有序性 程序的执行步骤是有序的,不可随意改变程序步骤的执行顺序。有限性 程序是有限的指令序列,程序所包含的步骤是有限的。操作性 有意义的程序总是对某些对象进行操作,使其改变状态,完成其功能。,计
20、算机程序具有以下性质:,40,数据结构是数据构造的逻辑表示形式,算法是处理问题的方法和步骤,最后问题的解由计算机程序给出。这是程序员在程序设计时应考虑的主要问题。,6.4.2 程序设计与数据结构、算法之间的关系,41,1.程序的控制结构一个可以用顺序、选择、循环和跳转(如goto语句)四种程序结构解决的问题,也一定能用顺序、选择、循环三种程序结构解决。但确实存在这样的问题,它可以用顺序、选择、循环三种程序结构解决,但不能用其中任何两种解决。换句话说,顺序、选择、循环三种程序结构构成了一个最小完备集。我们将这三种程序结构叫基本程序结构。,6.4.3 结构化程序设计,42,三种基本结构的图示:,顺
21、序结构,选择结构,43,循环结构的图示:,当型(While型)循环结构,直到型(Until型)循环,44,顺序程序设计,45,分支结构,46,循环结构,47,2.结构化程序设计方法结构化程序设计方法主要包括程序结构的自顶向下和模块化设计方法。,48,程序设计的一般步骤如下:1.分析问题 对要解决的问题,首先必须分析清楚,明确题目的要求,列出所有已知量,找出题目的求解范围、解的精度等。2.建立数学模型 对实际问题进行分析之后,找出它的内在规律,就可以建立数学模型。只有建立了模型的问题,才能可能利用计算机来解决。3.确定算法 建立数学模型后,还不能着手编程序,必须根据数据结构,确定解决问题的算法。一般确定算法要注意:算法的逻辑结构尽可能简单;算法所要求的存贮量应尽可能少;在满足题目条件要求下,使所需的计算量最小。,6.4.4 程序设计的步骤,49,4.编写程序 把整个程序看作一个整体,先全局后局部,自顶向下,一层一层分解处理,如果某些子问题的算法相同而仅参数不同,可以用子程序来表示。5.调试运行;6.分析结果;7.写出程序的文档 主要是对程序中的变量、函数或过程作必要的说明,解释编程思路,需要时给出程序流程图,并讨论运行结果。,