《数据结构第6章矩阵和广义表.ppt》由会员分享,可在线阅读,更多相关《数据结构第6章矩阵和广义表.ppt(50页珍藏版)》请在三一办公上搜索。
1、第六章 数组和广义表,前面讨论的线性结构中的数据元素都是非结构的原子类型,元素的值是不再分解的。本章讨论的两种数据结构数组和广义表可以看成是线性表在下述含义上的扩展:表中的数据元素本身也是一个数据结构。,6.1多维数组 6.1.1多维数组的概念,1一维数组一维数组可以看成是一个线性表或一个向量(第二章已经介绍),它在计算机内是存放在一块连续的存储单元中,适合于随机查找。这在第二章的线性表的顺序存储结构中已经介绍。,2二维数组二维数组可以看成是向量的推广。,例如,设A是一个有m行n列的二维数组,则A可以表示为:,在此,可以将二维数组A看成是由m个行向量X0,X1,Xm-1T组成,其中,Xi=(a
2、i0,ai1,.,ain-1),0im-1;也可以将二维数组A看成是由n个列向量y0,y1,yn-1组成,其中 yi=(a0i,a1i,.,am-1i),0in-1。,6.1.2 多维数组在计算机内的存放怎样将多维数组中元素存入到计算机内存中呢?由于计算机内存结构是一维的(线性的),因此,用一维内存存放多维数组就必须按某种次序将数组元素排成一个线性序列,然后将这个线性序列顺序存放在存储器中,6.2多维数组的存储结构由于数组一般不作插入或删除操作,也就是说,一旦建立了数组,则结构中的数组元素个数和元素之间的关系就不再发生变动,即它们的逻辑结构就固定下来了,不再发生变化。因此,采用顺序存储结构表示
3、数组是顺理成章的事了。本章中,仅重点讨论二维数组的存储,三维及三维以上的数组可以作类似分析。,3多维数组可以把三维以上的数组称为多维数组。,多维数组的顺序存储有两种形式:6.2.1 行优先顺序,1存放规则,行优先顺序也称为低下标优先或左边下标优先于右边下标。具体实现时,按行号从小到大的顺序,先将第一行中元素全部存放好,再存放第二行元素,第三行元素,依次类推,在BASIC语言、PASCAL语言、C/C+语言等高级语言程序设计中,都是按行优先顺序存放的。例如,对刚才的Amn二维数组,可用如下形式存放到内存:a00,a01,a0n-1,a10,a11,.,a1 n-1,am-1 0,am-1 1,a
4、m-1 n-1。即二维数组按行优先存放到内存后,变成了一个线性序列(线性表)。,因此,可以得出多维数组按行优先存放到内存的规律:最左边下标变化最慢,最右边下标变化最快,右边下标变化一遍,与之相邻的左边下标才变化一次。因此,在算法中,最左边下标可以看成是外循环,最右边下标可以看成是最内循环。,2地址计算,由于多维数组在内存中排列成一个线性序列,因此,若知道第一个元素的内存地址,如何求得其它元素的内存地址?我们可以将它们的地址排列看成是一个等差数列,假设每个元素占l个字节,元素aij 的存储地址应为第一个元素的地址加上排在aij前面的元素所占用的单元数,而aij 的前面有i行(0i-1)共in个元
5、素,而本行前面又有j个元素,故aij的前面一共有in+j个元素,设a00的内存地址为LOC(a00),则aij的内存地址按等差数列计算为LOC(aij)=LOC(a00)+(in+j)l。同理,三维数组Amnp按行优先存放的地址计算公式为:LOC(aijk)=LOC(a000)+(inp+jp+k)l。,6.2.2 列优先顺序,1存放规则,列优先顺序也称为高下标优先或右边下标优先于左边下标。具体实现时,按列号从小到大的顺序,先将第一列中元素全部存放好,再存放第二列元素,第三列元素,依次类推,在FORTRAN语言程序设计中,数组是按列优先顺序存放的。例如,对前面提到的Amn二维数组,可以按如下的
6、形式存放到内存:a00,a10,am-10,a01,a11,am-1 1,a0 m-1,a1m-1,.,am-1 n-1。即二维数组按列优先存放到内存后,也变成了一个线性序列(线性表)。,因此,可以得出多维数组按列优先存放到内存的规律:最右边下标变化最慢,最左边下标变化最快,左边下标变化一遍,与之相邻的右边下标才变化一次。因此,在算法中,最右边下标可以看成是外循环,最左边下标可以看成是最内循环。,2地址计算,同样与行优先存放类似,若知道第一个元素的内存地址,则同样可以求得按列优存放的某一元素aij的地址。对二维数组有:LOC(aij)=LOC(a00)+(jm+i)l对三维数组有:LOC(ai
7、jk)=LOC(a000)+(kmn+jm+i)l,5.3 特殊矩阵及其压缩存储,5.3.1 特殊矩阵,若一个n阶方阵A中元素满足下列条件:aij=aji 其中 0 i,jn-1,则称A为对称矩阵。例如,图5-1是一个3*3的对称矩阵。,1对称矩阵,2三角矩阵,(1)上三角矩阵即矩阵上三角部分元素是随机的,而下三角部分元素全部相同(为某常数C)或全为0,具体形式见图5-2(a)。,(2)下三角矩阵即矩阵的下三角部分元素是随机的,而上三角部分元素全部相同(为某常数C)或全为0,具体形式见图5-2(b)。,3对角矩阵,若矩阵中所有非零元素都集中在以主对角线为中心的带状区域中,区域外的值全为0,则称
8、为对角矩阵。常见的有三对角矩阵、五对角矩阵、七对角矩阵等。,例如,图5-3为77的三对角矩阵(即有三条对角线上元素非0)。,5.3.2 压缩存储,1对称矩阵,若矩阵Ann是对称的,对称的两个元素可以共用一个存储单元,这样,原来n 阶方阵需 n2个存储单元,若采用压缩存储,仅需 n(n+1)/2个存贮单元,将近节约一半存贮单元,这就是实现压缩的好处。但是,将n阶对称方阵存放到一个向量空间s0到s-1 中,我们怎样找到sk与aij的一一对称应关系呢?使我们在sk中直接找到aij。,我们仅以行优先存放分两种方式讨论:,(1)只存放下三角部分由于对称矩阵关于主对角线对称,故我们只需存放主对角线及主对角
9、线以下的元素。这时,a00存入s0,a10 存入s1,a11存入 s2,具体参见图5-4。这时sk与aij的对应关系为:,i(i+1)/2+j 当 ij k=j(j+1)/2+i 当 ij,上面的对应关系读者很容易推出:当ij 时,aij在下三角部分中,aij前面有i行,共有1+2+3+i个元素,而aij是第i行的第j个元素,即有k=1+2+3+i+j=i(i+1)/2+j;当ij时,aij在上三角部分中,但与aji对称,故只需在下三角部分中找aij即可,故只需将i与j交换即可,即k=j(j+1)/2+i。,(2)只存放上三角部分对于对称阵,除了用下三角形式存放外,还可以用上三角形式存放,这时
10、a00存入 s0,a01存入s1,a02存入 s2,具体参见图5-5。这时sk与aij的对应关系可以按下面方法推出:,当ij时,aij在上三角部分中,前面共有i行,共有n+n-1+n-(i-1)=i*n-个元素,而aij是本行第j-i个元素,故k=i*n-+j-i,当ij时,交换i与j即可。故sk与aij的对应关系为:,i*n-+j-i 当ij k=j*n-+i-j 当ij,2三角矩阵,(1)下三角矩阵下三角矩阵的压缩存放与对称矩阵用下三角形式存放类似,但必须多一个存储单元存放上三角部分元素,使用的存储单元数目为n(n+1)/2+1。故可以将nn的下三角矩阵压缩存放到只有n(n+1)/2+1个
11、存储单元的向量中,假设仍按行优先存放,这时sk与aij的对应关系为:,i(i+1)/2+j ij k=n(n+1)/2 ij,(2)上三角矩阵和下三角矩阵的存储类似,共需 n(n+1)/2+1个存贮单元,假设仍按行优先顺序存放,这时sk与aij的对应关系为:,i*n-i(i-1)/2+j-i 当ij k=n(n+1)/2 ij,3对角矩阵,我们仅讨论三对角矩阵的压缩存贮,五对角矩阵,七对角矩阵等读者可以作类似分析。在一个nn的三对角矩阵中,只有n+n-1+n-1个非零元素,故只需3n-2个存储单元即可,零元已不占用存储单元。故可将nn三对角矩阵A压缩存放到只有3n-2个存储单元的s向量中,假设
12、仍按行优先顺序存放,则:sk与aij的对应关系为:,3i-1 当 i=j+1k=3i 当i=j 3i+1 当i=j-1,5.4 稀疏矩阵,在上节提到的特殊矩阵中,元素的分布呈现某种规律,故一定能找到一种合适的方法,将它们进行压缩存放。但是,在实际应用中,我们还经常会遇到一类矩阵:其矩阵阶数很大,非零元个数较少,零元很多,但非零元的排列没有一定规律,我们称这一类矩阵为稀疏矩阵。,按照压缩存储的概念,要存放稀疏矩阵的元素,由于没有某种规律,除存放非零元的值外,还必须存贮适当的辅助信息,才能迅速确定一个非零元是矩阵中的哪一个位置上的元素。下面将介绍稀疏矩阵的几种存储方法及一些算法的实现。,5.4.1
13、 稀疏矩阵的存储,1三元组表,在压缩存放稀疏矩阵的非零元同时,若还存放此非零元所在的行号和列号,则称为三元组表法,即称稀疏矩阵可用三元组表进行压缩存储,但它是一种顺序存贮(按行优先顺序存放)。一个非零元有行号、列号、值,为一个三元组,整个稀疏矩阵中非零元的三元组合起来称为三元组表。,此时,数据类型可描述如下:const int maxsize=100;/定义非零元的最大数目struct node/定义一个三元组 int i,j;/非零元行、列号int v;/非零元值;struct sparmatrix/定义稀疏矩阵 int rows,cols;/稀疏矩阵行、列数int terms;/稀疏矩阵非
14、零元个数node data maxsize;/三元组表;,稀疏矩阵M和N的三元组表见图5-8。,2带行指针的链表,把具有相同行号的非零元用一个单链表连接起来,稀疏矩阵中的若干行组成若干个单链表,合起来称为带行指针的链表。例如,图5-6 的稀疏矩阵M的带行指针的链表描述形式见图5-9。,3十字链表,当稀疏矩阵中非零元的位置或个数经常变动时,三元组就不适合于作稀疏矩阵的存储结构,此时,采用链表作为存储结构更为恰当。十字链表为稀疏矩阵中的链接存储中的一种较好的存储方法,在该方法中,每一个非零元用一个结点表示,结点中除了表示非零元所在的行、列和值的三元组(i,j,v)外,还需增加两个链域:行指针域(r
15、ptr),用来指向本行中下一个非零元素;列指针域(cptr),用来指向本列中下一个非零元素。稀疏矩阵中同一行的非零元通过向右的rptr指针链接成一个带表头结点的循环链表。同一列的非零元也通过cptr指针链接成一个带表头结点的循链链表。因此,每个非零元既是第i行循环链表中的一个结点,又是第j列循环链表中的一个结点,相当于处在一个十字交叉路口,故称链表为十字链表。,另外,为了运算方便,我们规定行、列循环链表的表头结点和表示非零元的结点一样,也定为五个域,且规定行、列、域值为0,并且将所有的行、列链表和头结点一起链成一个循环链表。在行(列)表头结点中,行、列域的值都为0,故两组表头结点可以共用,即第
16、i行链表和第i列链表共用一个表头结点,这些表头结点本身又可以通过V域(非零元值域,但在表头结点中为next,指向下一个表头结点)相链接。另外,再增加一个附加结点(由指针hm指示,行、列域分别为稀疏矩阵的行、列数目),附加结点指向第一个表头结点,则整个十字链表可由hm指针唯一确定。,十字链表的数据类型描述如下:struct linknode int i,j;linknode*cptr,*rptr;union vnext/定义一个共用体 int v;/表结点使用V域,表示非零元值linknode*next;/表头结点使用next域 k;,例如,图5-6 的稀疏矩阵M的十字链表描述形式见图5-10。
17、,5.4.2 稀疏矩阵的运算,1稀疏矩阵的转置运算,转置是矩阵中最简单的一种运算。对于一个mn的矩阵A,它的转置B是一个nm 的,且Bij=Aji,0in,0jm。例如,图5-6给出的M矩阵和图5-7给出的N矩阵互为转置矩阵。,在三元组表表示的稀疏矩阵中,怎样求得它的转置呢?从转置的性质知道,将A转置为B,就是将A的三元组表a.data变为B的三元组表b.data,这时可以将a.data中i和j 的值互换,则得到的b.data是一个按列优先顺序排列的三元组表,再将它的顺序适当调整,变成行优先排列,即得到转置矩阵B。下面将用两种方法处理:,(1)按照A的列序进行转置,由于A的列即为B的行,在a.
18、data中,按列扫描,则得到的b.data必按行优先存放。但为了找到A的每一列中所有的非零的元素,每次都必须从头到尾扫描A的三元组表(有多少列,则扫描多少遍),这时算法描述如下:,void transpose(sparmatrix a,sparmatrix b)b.rows=a.cols;b.cols=a.rows;b.terms=a.terms;if(b.terms0)int bno=0;for(int col=0;cola.cols;col+)/按列号扫描 for(int ano=0;anoa.terms;ano+)/对三元组表扫描if(a.dataano.j=col)/进行转置 b.da
19、tabno.j=a.dataano.i;b.databno.i=a.dataano.j;b.databno.v=a.dataano.v;bno+;,分析这个算法,主要工作在col和ano二重循环上,故算法的时间复杂度为 O(a.cols*a.terms)。而通常的mn阶矩阵转置算法可描述为:for(col=0;coln;col+)for(row=0;rowm;row+)bcolrow=arowcol;它的时间复杂度为o(mn)。而一般的稀疏矩阵中非零元个数a.terms远大于行数 m,故压缩存贮时,进行转置运算,虽然节省了存贮单元,但增大了时间复杂度,故此算法仅适应于a.ternsa.rows
20、 a.cols的情形。,(2)按照A的行序进行转置,即按a.data中三元组的次序进行转置,并将转置后的三元组放入b中恰当的位置。若能在转置前求出矩阵A的每一列col(即B中每一行)的第一个非零元转置后在b.data中的正确位置potcol(0cola.cols),那么在对a.data的三元组依次作转置时,只要将三元组按列号col放置到b.datapotcol中,之后将potcol内容加1,以指示第col列的下一个非零元的正确位置。为了求得位置向量pot,只要先求出A的每一列中非零元个数numcol,然后利用下面公式:,pot0=0 potcol=potcol-1+numcol-1 当1col
21、a.cols,算法描述如下:void fastrans(sparmatrix a,sparmatrix b)int pot100,col,ano,bno;b.rows=a.cols;b.cols=a.rows;b.terms=a.terms;if(b.terms0)for(col=0;cola.cols;col+)potcol=0;for(int t=0;ta.terms;t+)/求出每一列的非零元个数 col=a.datat.j;potcol+1=potcol+1+;pot0=0;for(col=1;cola.cols;col+)/求出每一列的第一个非零元在转置后的位置potcol=potc
22、ol-1+potcol;,for(ano=0;anoa.terms;ano+)/转置 col=a.dataano.j;bno=potcol;b.databno.j=a.dataano.i;b.databno.i=a.dataano.j;b.databno.v=a.dataano.v;potcol=potcol+1;,该算法比按列转置多用了辅助向量空间pot,但它的时间为四个单循环,故总的时间复杂度为O(a.cols+a.terms),比按列转置算法效率要高。,2稀疏矩阵的相加运算,当稀疏矩阵用三元组表进行相加时,有可能出现非零元素的位置变动,这时候,不宜采用三元组表作存储结构,而应该采用十字链
23、表较方便。,5.5 广义表,5.5.1基本概念广义表是第二章提到的线性表的推广。线性表中的元素仅限于原子项,即不可以再分,而广义表中的元素既可以是原子项,也可以是子表(另一个线性表)。,1广义表的定义,广义表是n0个元素a1,a2,an的有限序列,其中每一个ai或者是原子,或者是一个子表。广义表通常记为LS=(a1,a2,an),其中LS为广义表的名字,n为广义表的长度,每一个ai为广义表的元素。但在习惯中,一般用大写字母表示广义表,小写字母表示原子。,2广义表举例,(1)A=(),A为空表,长度为0。(2)B=(a,(b,c)),B是长度为2的广义表,第一项为原子,第二项为子表。(3)C=(
24、x,y,z)C是长度为3的广义表,每一项都是原子。D=(B,C),D是长度为2的广义表,每一项都是上面提到的子表。E=(a,E)是长度为2的广义表,第一项为原子,第二项为它本身。,3广义表的表示方法,(1)用LS=(a1,a2,an)形式,其中每一个ai为原子或广义表例如:A=(b,c)B=(a,A)E=(a,E)都是广义表。,(2)将广义表中所有子表写到原子形式,并利用圆括号嵌套例如,上面提到的广义表A、B、C可以描述为:A(b,c)B(a,A(b,c)E(a,E(a,E()),(3)将广义表用树和图来描述,上面提到的广义表A、B、C的描述见图5-11。,4广义表的深度,一个广义表的深度是指
25、该广义表展开后所含括号的层数。例如,A=(b,c)的深度为1,B=(A,d)的深度为2,C=(f,B,h)的深度为3。,5广义表的分类,(1)线性表:元素全部是原子的广义表。(2)纯表:与树对应的广义表,见图5-11的(a)和(b)。(3)再入表:与图对应的广义表(允许结点共享),见图5-11的(c)。(4)递归表:允许有递归关系的广义表,例如E=(a,E)。,这四种表的关系满足:递归表再入表 纯表 线性表,5.5.2存储结构由于广义表的元素类型不一定相同,因此,难以用顺序结构存储表中元素,通常采用链接存储方法来存储广义表中元素,并称之为广义链表。常见的表示方法有:,1单链表表示法,即模仿线性
26、表的单链表结构,每个原子结点只有一个链域link,结点结构是:,可用如图5-12的结构描述广义表C=(A,B)=(x,(a,b),(x,(a,b),y),设头指针为hc。,2双链表表示法,每个结点含有两个指针及一个数据域,每个结点的结构如下:,例如,对图5-12用单链表表示的广义表C,可用图5-13的双链表方法表示。,5.5.3 基本运算广义表有许多运算,现仅介绍如下几种:,1.求广义表的深度depth(LS),假设广义表以刚才的单链表表示法作存储结构,则它的深度可以递归求出。即广义表的深度等于它的所有子表的最大深度加1,设dep表示任一子表的深度,max表示所有子表中表的最大深度,则广义表的
27、深度为:depth=max+1,算法描述如下:,int depth(node*LS)int max=0;while(LS!=NULL)if(LS-atom=0)/有子表 int dep=depth(LS-slink);if(depmax)max=dep;LS=LS-link;return max+1;该算法的时间复杂度为O(n)。,2.广义表的建立creat(LS),假设广义表以单链表的形式存储,广义表的元素类型elemtype 为字符型char,广义表由键盘输入,假定全部为字母,输入格式为:元素之间用逗号分隔,表元素的起止符号分别为左、右圆括号,空表在其圆括号内使用一个“#”字符表示,最后使
28、用一个分号作为整个广义表的结束。例如,给定一个广义表如下:LS=(a,(),b,c(d,(e),则从键盘输入的数据为:(a,(#),b,c(d,(e);,其中表示回车换行。具体算法描述如下:,void creat(node*LS)char ch;cinch;if(ch=#)LS=NULL;else if(ch=()LS=new node;LS-atom=0;creat(LS-slink);else LS=new node;LS-atom=1;LS-data=ch;cinch;if(LS=NULL);else if(ch=,)creat(LS-link);else if(ch=)|(ch=;)L
29、S-link=NULL;该算法的时间复杂度为O(n)。,3.输出广义表print(LS),void print(node*LS)if(LS-atom=0)coutslink=NULL)coutslink);elsecoutdata;if(LS-atom=0)coutlink!=NULL)coutlink);该算法的时间复杂度为O(n)。,4取表头运算head,若广义表LS=(a1,a2,an),则head(LS)=a1。取表头运算得到的结果可以是原子,也可以是一个子表。例如,head(a1,a2,a3,a4)=a1,head(a1,a2),(a3,a4),a5)=(a1,a2)。,5取表尾运算tail,若广义表LS=(a1,a2,an),则tail(LS)=(a2,a3,an)。即取表尾运算得到的结果是除表头以外的所有元素,取表尾运算得到的结果一定是一个子表。,值得注意的是广义表()和()是不同的,前者为空表,长度为0,后者的长度为1,可得到表头、表尾均为空表,即head()=(),tail()=()。,