数据结构课程chap01绪论.ppt

资源描述

《数据结构课程chap01绪论.ppt》由会员分享，可在线阅读，更多相关《数据结构课程chap01绪论.ppt（79页珍藏版）》请在三一办公上搜索。

1、数据结构与算法,中国人民大学信息学院经济信息管理系蒋洪迅01082500904,数据结构是中国人民大学信息学院所有专业本科生的一门必修课程。数据结构是计算机相关专业的一门重要的专业基础课。它主要研究计算机加工对象的逻辑结构、在计算机中的表示形式以及实现各种基本操作的算法。它是学习操作系统、编译原理、数据库原理等计算机专业核心课程的基础，掌握好这门课程的内容，是学习计算机其他相关课程的必备条件。先修课：Java程序设计、计算机数学(离散数学),课程简介,严蔚敏等，数据结构，清华大学出版社，1997Robert Lafore,Data Structures&Algorithms in Java(英

2、文影印版),Published by Waite Group Press,1998,617 pagesDuane A.Bailey,数据结构Java描述-数据结构的设计原则与Java实现（英文影印版）,Prentice Hall/Pearson,清华大学出版社,1999,369 pagesClifford A.Shaffer,A Practical Introduction to Data Structures and Algorithm Analysis(Java Edition),电子工业出版社,2001黄国瑜，叶乃菁，数据结构，Java 语言版，清华大学出版社，2002,参考书目,课程学

3、习方法与要求,本课程将分别讲述数据结构的基本概念、线性表、栈和队列、串和数组、树形结构、图结构、查找、排序和文件等内容。学习本课程的基本方法 l上课认真听讲；l仔细阅读教材中的大量例题，从而体会并最终掌握数据结构中的基本概念；l独立完成每个章节后面的练习题；l认真完成实验及课程设计。,实验上机：在微机上即可。安装JAVA的编译程序使用Borland Java Builder 或 JDK 都可以。本着教学相长的精神，希望经常对教学效果作出反馈，以便及时改进教学方法。学好一门课程，教师的引导固然十分重要，但主要靠学员的自身努力。课堂教学可以起到画龙点睛的作用，但只有不断练习，才能巩固、掌握课程的内

4、容。因此，本课程要求同学积极独立完成所布置的习题。,上机作业,http:/course/dataStructure,课程网站,课时安排,平时作业（上机题）20%（能够按时、按质、按量完成平时作业者方可得满分）期中考试（开卷机考）10%期末采用闭卷笔试，它占总成绩的 70%。,考核形式,课程的内容框架,第一章绪论,1.1 数据结构讨论的范畴,1.2 基本概念,1.3 算法和算法的量度,1.1 数据结构讨论的范畴,Niklaus Wirth：Algorithm+Data Structures=Programs,程序设计:算法:数据结构:,为计算机处理问题编制一组指令集,处理问题的策略,问题的数

5、学模型,结构静力分析计算,例如:数值计算的程序设计问题,线性代数方程组,环流模式方程(球面坐标系),全球天气预报,非数值计算的程序设计问题,例一:求一组(n个)整数中的最大值,算法:?模型：？,基本操作是“比较两个数的大小”,取决于整数值的范围,例二：计算机对弈,算法：?模型：?,对弈的规则和策略,棋盘及棋盘的格局,例三：足（猪）协的数据库管理,算法：?模型：?,需要管理的项目？如何管理？用户界面？,各种表格,概括地说：,数据结构是一门讨论“描述现实世界实体的数学模型(非数值计算)及其上的操作在计算机中如何表示和实现”的学科。,概括地说：,机外表示处理要求,逻辑结构基本运算,存储结构算法实现,

6、1.2 基本概念,一、数据与数据结构,二、数据类型,三、抽象数据类型,一、数据与数据结构,所有能被输入到计算机中，且能被计算机处理的符号的集合。,数据:,是计算机操作的对象的总称。,是计算机处理的信息的某种特定的符号表示形式。,是数据（集合）中的一个“个体”,数据元素:,是数据结构中讨论的基本单位。,数据项：,是数据结构中讨论的最小单位,数据元素可以是数据项的集合,例如：,描述一个运动员的数据元素可以是,称之为组合项,数据结构：,带结构的数据元素的集合,假设用三个 4 位的十进制数表示一个含 12 位数的十进制数。,3214,6587,9345 a1(3214),a2(6587),a3(934

7、5),则在数据元素 a1、a2 和 a3 之间存在着“次序”关系 a1,a2、a2,a3,3214，6587，9345 a1 a2 a3,6587，3214，9345 a2 a1 a3,例如:,又例，在2行3列的二维数组a1,a2,a3,a4,a5,a6中六个元素之间存在两个关系:,行的次序关系:列的次序关系:,row=,col=,a1 a3 a5 a2 a4 a6,a1 a2 a3a4 a5 a6,再例，在一维数组 a1,a2,a3,a4,a5,a6 的数据元素之间存在如下的次序关系:,|i=1,2,3,4,5,或者说，数据结构是相互之间存在着某种逻辑关系的数据元素的集合。,可见，不同的“关

8、系”构成不同的“结构”,数据的逻辑结构可归结为以下四类:,线性结构,树形结构,图状结构,集合结构,数据结构的形式定义为:,数据结构是一个二元组,Data_Structures=(D,S),其中:D 是数据元素的有限集，S 是 D上关系的有限集。,数据的存储结构,逻辑结构在存储器中的映象,“数据元素”的映象？,“关系”的映象？,数据元素的映象方法：,用二进制位(bit)的位串表示数据元素,(321)10=(501)8=(101000001)2,A=(101)8=(001000001)2,关系的映象方法：,（表示x,y的方法）,顺序映象,以相对的存储位置表示后继关系,例如:令 y 的存储位置和 x

9、的存储位置之间差一个常量 C,而 C 是一个隐含值，整个存储结构中只含数据元素本身的信息,x y,链式映象,以附加信息(指针)表示后继关系,需要用一个和 x 在一起的附加信息指示 y 的存储位置,y x,在不同的编程环境中，,存储结构可有不同的描述方法。,当用高级程序设计语言进行编程时，通常可用高级编程语言中提供的数据类型描述之。,例如:,以三个带有次序关系的整数表示一个长整数时，可利用 C 语言中提供的整数数组类型。,typedef int Long_int 3,定义长整数为:,二、数据类型,在用高级程序语言编写的程序中，必须对程序中出现的每个变量、常量或表达式，明确说明它们所属的数据类

10、型。,例如，C 语言中提供的基本数据类型有:,整型 int,浮点型 float,字符型 char,逻辑型 bool（C+语言）,双精度型 double,实型（C+语言）,数据类型是一个值的集合和定义在此集合上的一组操作的总称。,不同类型的变量，其所能取的值的范围不同，所能进行的操作不同。,三、抽象数据类型(Abstract Data Type 简称ADT),是指一个数学模型以及定义在此数学模型上的一组操作。,例如，抽象数据类型复数的定义：,数据对象：De1,e2e1,e2RealSet 数据关系：R1|e1是复数的实数部分|e2 是复数的虚数部分,ADT Complex,基本操作：,As

11、signComplex(&Z,v1,v2)操作结果：构造复数 Z,其实部和虚部分别被赋以参数 v1 和 v2 的值。,DestroyComplex(&Z)操作结果：复数Z被销毁。,GetReal(Z,&realPart)初始条件：复数已存在。操作结果：用realPart返回复数Z的实部值。,GetImag(Z,&ImagPart)初始条件：复数已存在。操作结果：用ImagPart返回复数Z的虚部值。,Add(z1,z2,&sum)初始条件：z1,z2是复数。操作结果：用sum返回两个复数z1,z2 的和值。,ADT Complex,假设:z1和z2是上述定义的复数,则 Add(z1,z2,

12、z3)操作的结果,z3=z1+z2,即为用户企求的结果,ADT 有两个重要特征:,数据抽象,用ADT描述程序处理的实体时，强调的是其本质的特征、其所能完成的功能以及它和外部用户的接口（即外界使用它的方法）。,数据封装,将实体的外部特性和其内部实现细节分离，并且对外部用户隐藏其内部实现细节。,抽象数据类型的描述方法,抽象数据类型可用（D，S，P）三元组表示。其中：D 是数据对象；S 是 D 上的关系集；P 是对 D 的基本操作集。,ADT 抽象数据类型名数据对象：数据对象的定义数据关系：数据关系的定义基本操作：基本操作的定义 ADT 抽象数据类型名,其中基本操作的定义格式为:,基本操作名（

13、参数表）初始条件：初始条件描述操作结果：操作结果描述,赋值参数只为操作提供输入值。引用参数以&打头，除可提供输入值外，还将返回操作结果。,初始条件描述了操作执行之前数据结构和参数应满足的条件，若不满足，则操作失败，并返回相应出错信息。,操作结果说明了操作正常完成之后，数据结构的变化状况和应返回的结果。若初始条件为空，则省略之。,抽象数据类型的表示和实现,抽象数据类型需要通过固有数据类型(高级编程语言中已实现的数据类型)来实现。,例如，对以上定义的复数。,typedef struct float realpart；float imagpart；complex；,/-存储结构的定义,/-

14、基本操作的函数原型说明,void Assign(complex&Z,float realval,float imagval)；/构造复数 Z,其实部和虚部分别被赋以参数/realval 和 imagval 的值,float GetReal(cpmplex Z)；/返回复数 Z 的实部值,float Getimag(cpmplex Z)；/返回复数 Z 的虚部值,void add(complex z1,complex z2,complex&sum)；/以 sum 返回两个复数 z1,z2 的和,/-基本操作的实现,void add(complex z1,complex z2,complex,其它

15、省略,1.3 算法和算法的衡量,一、算法,二、算法设计的原则,三、算法效率的衡量方法和准则,四、算法的存储空间需求,算法是为了解决某类问题而规定的一个有限长的操作序列。一个算法必须满足以下五个重要特性：,1有穷性 2确定性 3可行性4有输入 5有输出,一、算法,1有穷性对于任意一组合法输入值，在执行有穷步骤之后一定能结束，即：算法中的每个步骤都能在有限时间内完成,2确定性对于每种情况下所应执行的操作，在算法中都有确切的规定，使算法的执行者或阅读者都能明确其含义及如何执行。并且在任何条件下，算法都只有一条执行路径。,3可行性算法中的所有操作都必须足够基本，都可以通过已经实现的基本操作运算有

16、限次实现之。,4有输入作为算法加工对象的量值，通常体现为算法中的一组变量。有些输入量需要在算法执行过程中输入，而有的算法表面上可以没有输入，实际上已被嵌入算法之中。,5有输出它是一组与“输入”有确定关系的量值，是算法进行信息加工后得到的结果，这种确定关系即为算法的功能。,二、算法设计的原则,设计算法时，通常应考虑达到以下目标：,1正确性,2.可读性,3健壮性,4高效率与低存储量需求,1正确性,首先，算法应当满足以特定的“规格说明”方式给出的需求。,其次，对算法是否“正确”的理解可以有以下四个层次：,a程序中不含语法错误；,b程序对于几组输入数据能够得出满足要求的结果；,c程序对于精心选择的

17、、典型、苛刻且带有刁难性的几组输入数据能够得出满足要求的结果；,通常以第 c 层意义的正确性作为衡量一个算法是否合格的标准。,d程序对于一切合法的输入数据都能得出满足要求的结果；,2.可读性,算法主要是为了人的阅读与交流，其次才是为计算机执行，因此算法应该易于人的理解；另一方面，晦涩难读的程序易于隐藏较多错误而难以调试。,3健壮性,当输入的数据非法时，算法应当恰当地作出反映或进行相应处理，而不是产生莫名奇妙的输出结果。并且，处理出错的方法不应是中断程序的执行，而应是返回一个表示错误或错误性质的值，以便在更高的抽象层次上进行处理。,4高效率与低存储量需求,通常，效率指的是算法执行时间；存储量指的

18、是算法执行过程中所需的最大存储空间，两者都与问题的规模有关。,三、算法效率的衡量方法和准则,通常有两种衡量算法效率的方法:,事后统计法,事前分析估算法,缺点：1必须执行程序 2其它因素掩盖算法本质,和算法执行时间相关的因素：,1算法选用的策略,2问题的规模,3编写程序的语言,4编译程序产生的机器代码的质量,5计算机执行指令的速度,一个特定算法的“运行工作量”的大小，只依赖于问题的规模（通常用整数量n表示），或者说，它是问题规模的函数。,假如，随着问题规模 n 的增长，算法执行时间的增长率和 f(n)的增长率相同，则可记作：,T(n)=O(f(n),称T(n)为算法的(渐近)时间复杂度。,如何

19、估算算法的时间复杂度？,算法=控制结构+原操作（固有数据类型的操作）,算法的执行时间=原操作(i)的执行次数原操作(i)的执行时间,算法的执行时间与原操作执行次数之和成正比,从算法中选取一种对于所研究的问题来说是基本操作的原操作，以该基本操作在算法中重复执行的次数作为算法运行时间的衡量准则。,例一两个矩阵相乘,void mult(int a,int b,int/for/mult,基本操作:乘法操作,时间复杂度:O(n3),例二起泡排序,void bubble_sort(int-i)/bubble_sort,基本操作:赋值操作,时间复杂度:O(n2),change=FALSE;/

20、change 为元素进行交换标志 for(j=0;j aj+1)aj aj+1;change=TRUE;/一趟起泡,起泡排序,起泡排序有两个结束条件，或i=1或“一趟起泡”中没有进行过一次交换操作，后者说明该序列已经有序。因此起泡排序的算法执行时间和序列中整数的初始排列状态有关，它在初始序列本已从小到大有序时达最小值，而在初始序列从大到小逆序时达最大值，在这种情况下，通常以最坏的情况下的时间复杂度为准。,例三选择排序,void select_sort(int&a,int n)/将 a 中整数序列重新排列成自小至大有序的整数序列。/select_sort,基本操作:比较(数据元素)操作,时间复杂

21、度:O(n2),j=i;/选择第 i 个最小元素for(k=i+1;k n;+k)if(ak aj)j=k;,for(i=0;i n-1;+i)if(j!=i)aj ai,四、算法的存储空间需求,算法的空间复杂度定义为:,表示随着问题规模 n 的增大，算法运行所需存储量的增长率与 g(n)的增长率相同。,S(n)=O(g(n),算法的存储量包括:,1输入数据所占空间,2程序本身所占空间,3辅助变量所占空间,若输入数据所占空间只取决于问题本身，和算法无关，则只需要分析除输入和程序之外的辅助变量所占额外空间。,若所需额外空间相对于输入数据量来说是常数，则称此算法为原地工作。,若所需存储量依

22、赖于特定的输入，则通常按最坏情况考虑。,1.熟悉各名词、术语的含义，掌握基本概念。,2.理解算法五个要素的确切含义。,本章学习要点,3.掌握计算语句频度和估算算法时间复杂度的方法。,本章学习要点,本章知识点的联络图,练习,下面程序段的时间复杂度为()for(inti=0;im;i+)for(intj=0;jn;j+)aij=i*j;,练习,设有一个递归算法如下 int fact(int n)/n大于等于0 if(n=0)return 1;else return n*fact(-n);则计算fact(n)需要调用该函数的次数为()次，不计fact(n)。An Bn+1 Cn+2 Dn-l,作业一：猜数位,首先自动产生一个n位09数字，每位上的数字互不相同。然后，程序接受玩家输入所猜测的n位不重复的数字；接着，由程序比对符合的位数以及不符合但有出现的数字的数量。完全符合的数字会以A来表示，而不符合正确位置但有出现的数字则以B来表示。举例，如果正确答案是2345且玩家猜的是4395，则会得到2A1B。最后，玩家在m次内猜测出完全相符的数字组合即为胜利。若没有在指定m回合完成，则给出准确答案。注：m,n可由玩家自定。若不设定,其缺省为n4；m12。,

展开阅读全文