《编译原理答案》PPT课件.ppt

上传人:牧羊曲112 文档编号:5569021 上传时间:2023-07-29 格式:PPT 页数:689 大小:3.67MB
返回 下载 相关 举报
《编译原理答案》PPT课件.ppt_第1页
第1页 / 共689页
《编译原理答案》PPT课件.ppt_第2页
第2页 / 共689页
《编译原理答案》PPT课件.ppt_第3页
第3页 / 共689页
《编译原理答案》PPT课件.ppt_第4页
第4页 / 共689页
《编译原理答案》PPT课件.ppt_第5页
第5页 / 共689页
点击查看更多>>
资源描述

《《编译原理答案》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《编译原理答案》PPT课件.ppt(689页珍藏版)》请在三一办公上搜索。

1、,编译原理教程(第三版)习题解析与上机指导,胡元义等 编著,西安电子科技大学出版社,普通高等院校计算机类专业系列教材,目 录,第一章 绪论第二章 词法分析第三章 语法分析第四章 语义分析和中间代码生成第五章 代码优化第六章 运行时存储空间组织第七章 目标代码生成第八章 符号表与错误处理第九章 小型编译程序介绍第十章 上机实验内容第十一章 小型编译程序,第一章 绪论,1.1 完成下列选择题:(1)构造编译程序应掌握。a.源程序 b.目标语言 c.编译方法 d.以上三项都是(2)编译程序绝大多数时间花在 上。a.出错处理 b.词法分析 c.目标代码生成 d.表格管理,(3)编译程序是对。a.汇编程

2、序的翻译 b.高级语言程序的解释执行 c.机器语言的执行 d.高级语言的翻译【解答】(1)d(2)d(3)d 1.2 计算机执行用高级语言编写的程序有哪些途径?它们之间的主要区别是什么?【解答】计算机执行用高级语言编写的程序主要有两种途径:解释和编译。,在解释方式下,翻译程序事先并不采用将高级语言程序全部翻译成机器代码程序,然后执行这个机器代码程序的方法,而是每读入一条源程序的语句,就将其解释(翻译)成对应其功能的机器代码语句串并执行,而所翻译的机器代码语句串在该语句执行后并不保留,最后再读入下一条源程序语句,并解释执行。这种方法是按源程序中语句的动态执行顺序逐句解释(翻译)执行的,如果一语句

3、处于一循环体中,则每次循环执行到该语句时,都要将其翻译成机器代码后再执行。,在编译方式下,高级语言程序的执行是分两步进行的:第一步首先将高级语言程序全部翻译成机器代码程序,第二步才是执行这个机器代码程序。因此,编译对源程序的处理是先翻译,后执行。从执行速度上看,编译型的高级语言比解释型的高级语言要快,但解释方式下的人机界面比编译型好,便于程序调试。这两种途径的主要区别在于:解释方式下不生成目标代码程序,而编译方式下生成目标代码程序。,1.3 请画出编译程序的总框图。如果你是一个编译程序的总设计师,设计编译程序时应当考虑哪些问题?【解答】编译程序总框图如图1-1所示。,图1-1 编译程序总框图,

4、作为一个编译程序的总设计师,首先要深刻理解被编译的源语言其语法及语义;其次,要充分掌握目标指令的功能及特点,如果目标语言是机器指令,还要搞清楚机器的硬件结构以及操作系统的功能;第三,对编译的方法及使用的软件工具也必须准确化。总之,总设计师在设计编译程序时必须估量系统功能要求、硬件设备及软件工具等诸因素对编译程序构造的影响等。,第二章 词法分析,2.1 完成下列选择题:(1)词法分析器的输出结果是。a.单词的种别编码 b.单词在符号表中的位置 c.单词的种别编码和自身值 d.单词自身值(2)正规式M1和M2等价是指。a.M1和M2的状态数相等 b.M1和M2的有向边条数相等 c.M1和M2所识别

5、的语言集相等 d.M1和M2状态数和有向边条数相等,(3)DFA M(见图2-1)接受的字集为。a.以0开头的二进制数组成的集合 b.以0结尾的二进制数组成的集合 c.含奇数个0的二进制数组成的集合 d.含偶数个0的二进制数组成的集合【解答】(1)c(2)c(3)d,图2-1 习题2.1的DFA M,2.2 什么是扫描器?扫描器的功能是什么?【解答】扫描器就是词法分析器,它接受输入的源程序,对源程序进行词法分析并识别出一个个单词符号,其输出结果是单词符号,供语法分析器使用。通常是把词法分析器作为一个子程序,每当词法分析器需要一个单词符号时就调用这个子程序。每次调用时,词法分析器就从输入串中识别

6、出一个单词符号交给语法分析器。,2.3 设M=(x,y,a,b,f,x,y)为一非确定的有限自动机,其中f定义如下:f(x,a)=x,y fx,b=y f(y,a)=fy,b=x,y试构造相应的确定有限自动机M。【解答】对照自动机的定义M=(S,f,So,Z),由f的定义可知f(x,a)、f(y,b)均为多值函数,因此M是一非确定有限自动机。先画出NFA M相应的状态图,如图2-2所示。,图2-2 习题2.3的NFA M,用子集法构造状态转换矩阵,如表2-1所示。,表2-1 状态转换矩阵,将转换矩阵中的所有子集重新命名,形成表2-2所示的状态转换矩阵,即得到M=(0,1,2,a,b,f,0,1

7、,2),其状态转换图如图2-3所示。,表2-2 状态转换矩阵,将图2-3所示的DFA M最小化。首先,将M的状态分成终态组1,2与非终态组0。其次,考察1,2,由于1,2a=1,2b=21,2,所以不再将其划分了,也即整个划分只有两组:0和1,2。令状态1代表1,2,即把原来到达2的弧都导向1,并删除状态2。最后,得到如图2-4所示的化简了的DFA M。,图2-3 习题2.3的DFA M,图2-4 图2-3化简后的DFA M,2.4 正规式(ab)*a与正规式a(ba)*是否等价?请说明理由。【解答】正规式(ab)*a对应的NFA如图2-5所示,正规式a(ba)*对应的NFA如图2-6所示。,

8、图2-5 正规式(ab)*a对应的NFA,图2-6 正规式a(ba)*对应的DFA,这两个正规式最终都可得到最简DFA,如图2-7所示。因此,这两个正规式等价。,图2-7 最简NFA,2.5 设有L(G)=a2n+1b2ma2p+1|n0,p0,m1。(1)给出描述该语言的正规表达式;(2)构造识别该语言的确定有限自动机(可直接用状态图形式给出)。【解答】该语言对应的正规表达式为a(aa)*bb(bb)*a(aa)*,正规表达式对应的NFA如图2-8所示。,图2-8 习题2-5的NFA,用子集法将图2-8确定化,如图2-9所示。由图2-9重新命名后的状态转换矩阵可化简为(也可由最小化方法得到)

9、0,2 1 3,5 4,6 7按顺序重新命名为0、1、2、3、4后得到最简的DFA,如图2-10所示。,图2-9 习题2.5的状态转换矩阵,图2-10 习题2.5的最简DFA,2.6 有语言L=w|w(0,1)+,并且w中至少有两个1,又在任何两个1之间有偶数个0,试构造接受该语言的确定有限状态自动机(DFA)。【解答】对于语言L,w中至少有两个1,且任意两个1之间必须有偶数个0;也即在第一个1之前和最后一个1之后,对0的个数没有要求。据此我们求出L的正规式为0*1(00(00)*1)*00(00)*10*,画出与正规式对应的NFA,如图2-11所示。,图2-11 习题2.6的NFA,用子集法

10、将图2-11的NFA确定化,如图2-12所示。,图2-12 习题2.6的状态转换矩阵,由图2-12可看出非终态2和4的下一状态相同,终态6和8的下一状态相同,即得到最简状态为0、1、2,4、3、5、6,8、7按顺序重新命名为0、1、2、3、4、5、6,则得到最简DFA,如图2-13所示。,图2-13 习题2.6的最简DFA,2.7 已知正规式(a|b)*|aa)*b和正规式(a|b)*b。(1)试用有限自动机的等价性证明这两个正规式是等价的;(2)给出相应的正规文法。【解答】(1)正规式(a|b)*|aa)*b对应的NFA如图2-14所示。,图2-14 正规式(a|b)*|aa)*b对应的NF

11、A,用子集法将图2-14所示的NFA确定化为DFA,如图2-15所示。,图2-15 图2-14确定化后的状态转换矩阵,由于对非终态的状态1、2来说,它们输入a、b的下一状态是一样的,故状态1和状态2可以合并,将合并后的终态3命名为2,则得到表2-3(注意,终态和非终态即使输入a、b的下一状态相同也不能合并)。由此得到最简DFA,如图2-16所示。正规式(a|b)*b对应的NFA如图2-17所示。,表2-3 合并后的状态转换矩阵,图2-16 习题2.7的最简DFA,图2-17 正规式(a|b)*b对应的NFA,用子集法将图2-17所示的NFA确定化为如图2-18所示的状态转换矩阵。,图2-18

12、图2-17确定化后的状态转换矩阵,比较图2-18与图2-15,重新命名后的转换矩阵是完全一样的,也即正规式(a|b)*b可以同样得到化简后的DFA如图2-16所示。因此,两个自动机完全一样,即两个正规文法等价。(2)对图2-16,令A对应状态1,B对应状态2,则相应的正规文法GA为GA:AaA|bB|b BaA|bB|bGA可进一步化简为GS:SaS|bS|b(非终结符B对应的产生式与A对应的产生式相同,故两非终结符等价,即可合并为一个产生式)。,2.8 下列程序段以B表示循环体,A表示初始化,I表示增量,T表示测试:I=1;while(I=n)sun=sun+aI;I=I+1;请用正规表达式

13、表示这个程序段可能的执行序列。,【解答】用正规表达式表示程序段可能的执行序列为A(TBI)*。2.9 将图2-19所示的非确定有限自动机(NFA)变换成等价的确定有限自动机(DFA)。,图2-19 习题2.9的NFA,其中,X为初态,Y为终态。【解答】用子集法将NFA确定化,如图2-20所示。,图2-20 习题2.9的状态转换矩阵,图2-20所对应的DFA如图2-21所示。,图2-21 习题2.9的DFA,图2-22 习题2.9的最简DFA,对图2-21的DFA进行最小化。首先将状态分为非终态集和终态集两部分:0,1,2,5和3,4,6,7。由终态集可知,对于状态3、6、7,无论输入字符是a还

14、是b的下一状态均为终态集,而状态4在输入字符b的下一状态落入非终态集,故将其化为分0,1,2,5,4,3,6,7对于非终态集,在输入字符a、b后按其下一状态落入的状态集不同而最终划分为0,1,2,5,4,3,6,7按顺序重新命名为0、1、2、3、4、5,得到最简DFA如图2-22所示。,2.10 有一台自动售货机,接收1分和2分硬币,出售3分钱一块的硬糖。顾客每次向机器中投放3分的硬币,便可得到一块糖(注意:只给一块并且不找钱)。(1)写出售货机售糖的正规表达式;(2)构造识别上述正规式的最简DFA。【解答】(1)设a=1,b=2,则售货机售糖的正规表达式为a(b|a(a|b)|b(a|b)。

15、(2)画出与正规表达式a(b|a(a|b)|b(a|b)对应的NFA,如图2-23所示。,图2-23 习题2.10的NFA,用子集法将图2-21的NFA确定化,如图2-24所示。,图2-24 习题2.10的状态转换矩阵,由图2-24可看出,非终态2和非终态3面对输入符号a或b的下一状态相同,故合并为一个状态,即最简状态0、1、2,3、4。按顺序重新命名为0、1、2、3,则得到最简DFA,如图2-25所示。,图2-25 习题2.10的最简DFA,第三章 语法分析,3.1 完成下列选择题:(1)文法G:SxSx|y所识别的语言是。a.xyx b.(xyx)*c.xnyxn(n0)d.x*yx*(2

16、)如果文法G是无二义的,则它的任何句子。a.最左推导和最右推导对应的语法树必定相同b.最左推导和最右推导对应的语法树可能不同c.最左推导和最右推导必定相同d.可能存在两个不同的最左推导,但它们对应的语法树相同,(3)采用自上而下分析,必须。a.消除左递归 b.消除右递归c.消除回溯 d.提取公共左因子(4)设a、b、c是文法的终结符,且满足优先关系ab和bc,则。a.必有ac b.必有cac.必有ba d.ac都不一定成立,(5)在规范归约中,用 来刻画可归约串。a.直接短语 b.句柄 c.最左素短语 d.素短语(6)若a为终结符,则Aa为 项目。a.归约 b.移进 c.接受 d.待约(7)若

17、项目集Ik含有A,则在状态k时,仅当面临的输入符号aFOLLOW(A)时,才采取“A”动作的一定是。a.LALR文法 b.LR(0)文法 c.LR(1)文法 d.SLR(1)文法,(8)同心集合并有可能产生新的 冲突。a.归约 b.“移进”/“移进”c.“移进”/“归约”d.“归约”/“归约”【解答】(1)c(2)a(3)c(4)d(5)b(6)b(7)d(8)d3.2 令文法GN为 GN:ND|ND D0|1|2|3|4|5|6|7|8|9(1)GN的语言L(GN)是什么?(2)给出句子0127、34和568的最左推导和最右推导。,【解答】(1)GN的语言L(GN)是非负整数。(2)最左推导

18、:NNDNDDNDDDDDDD0DDD01DD012D0127 NNDDD3D34 NNDNDDDDD5DD56D568最右推导:NNDN7ND7N27ND27N127D1270127 NNDN4D434 NNDN8ND8N68D68568,3.3 已知文法GS为SaSb|Sb|b,试证明文法GS为二义文法。【解答】由文法GS:SaSb|Sb|b,对句子aabbbb可对应如图3-1所示的两棵语法树。,图3-1 句子aabbbb对应的两棵不同语法树,因此,文法GS为二义文法(对句子abbb也可画出两棵不同语法树)。3.4 已知文法GS为SSaS|,试证明文法GS为二义文法。【解答】由文法GS:S

19、SaS|,句子aa的语法树如图3-2所示。,图3-2 句子aa对应的两棵不同的语法树,由图3-2可知,文法GS为二义文法。3.5 按指定类型,给出语言的文法。(1)L=aibj|ji0的上下文无关文法;(2)字母表=a,b上的同时只有奇数个a和奇数个b的所有串的集合的正规文法;(3)由相同个数a和b组成句子的无二义文法。【解答】(1)由L=aibj|ji0知,所求该语言对应的上下文无关文法首先应有SaSb型产生式,以保证b的个数不少于a的个数;其次,还需有SSb或Sb型的产生式,用以保证b的个数多于a的个数。因此,所求上下文无关文法GS为GS:SaSb|Sb|b,(2)为了构造字母表=a,b上

20、同时只有奇数个a和奇数个b的所有串集合的正规式,我们画出如图3-3所示的DFA,即由开始符S出发,经过奇数个a到达状态A,或经过奇数个b到达状态B;而由状态A出发,经过奇数个b到达状态C(终态);同样,由状态B出发经过奇数个a到达终态C。由图3-3可直接得到正规文法GS如下:GS:SaA|bB AaS|bC|b BbS|aC|a CbA|aB|,图3-3 习题3.5的DFA,(3)我们用一个非终结符A代表一个a(即有Aa),用一个非终结符B代表一个b(即有Bb);为了保证a和b的个数相同,则在出现一个a时应相应地出现一个B,出现一个b时则相应出现一个A。假定已推导出bA,如果下一步要推导出连续

21、两个b时,则应有bAbbAA。也即为了保证b和A的个数一致,应有AbAA;同理有BaBB。此外,为了保证递归地推出所要求的ab串,应有SaBS和SbAS。由此得到无二义文法GS为 GS:SaBS|bAS|AbAA|a BaBB|b,3.6 有文法GS:SaAcB|BdAAaB|cBbScA|b(1)试求句型aAaBcbbdcc和aAcbBdcc的句柄;(2)写出句子acabcbbdcc的最左推导过程。【解答】(1)分别画出对应句型aAaBcbbdcc和aAcbBdcc的语法树如图3-4的(a)、(b)所示。,图3-4 习题3.6的语法树(a)aAaBcbbdcc;(b)aAcbBdcc,对树(

22、a),直接短语有3个:AaB、b和c,而AaB为最左直接短语(即为句柄)。对树(b),直接短语有两个:Bd和c,而Bd为最左直接短语。能否不画出语法树,而直接由定义(即在句型中)寻找满足某个产生式的候选式这样一个最左子串(即句柄)呢?例如,对句型aAaBcbbdcc,我们可以由左至右扫描找到第一个子串AaB,它恰好是满足AAaB右部的子串;与树(a)对照,AaB的确是该句型的句柄。是否这一方法始终正确呢?我们继续检查句型aAcbBdcc,由左至右找到第一个子串c,这是满足AC右部的子串,但由树(b)可知,c不是该句型的句柄。由此可知,画出对应句型的语法树然后寻找最左直接短语是确定句柄的好方法。

23、,(2)句子acabcbbdcc的最左推导如下:SaAcBaAaBcBacaBcBacabcBacabcbScAacabcbBdcA acabcbbdcAacabcbbdcc3.7 对于文法GS:S(L)|aS|aLL,S|S(1)画出句型(S,(a)的语法树;(2)写出上述句型的所有短语、直接短语、句柄、素短语和最左素短语。【解答】(1)句型(S,(a)的语法树如图3-5所示。,图3-5 句型(S,(a)的语法树,(2)由图3-5可知:短语:S、a、(a)、S,(a)、(S,(a);直接短语:a、S;句柄:S;素短语:素短语可由图3-5中相邻终结符之间的优先关系求得,即:#(,(a)#因此,

24、素短语为a。,3.8 下述文法描述了C语言整数变量的声明语句:GD:DTLTint|long|shortLid|L,id(1)改造上述文法,使其接受相同的输入序列,但文法是右递归的;(2)分别用上述文法GD和改造后的文法GD为输入序列int a,b,c构造分析树。,【解答】(1)消除左递归后,文法GD如下:DTLTint|long|shortLidL,图3-6 两种文法为int a,b,c构造的分析树(a)文法G(D);(b)文法G(D),3.9 考虑文法GS:S(T)|a+S|aTT,S|S消除文法的左递归及提取公共左因子,然后对每个非终结符写出不带回溯的递归子程序。【解答】消除文法GS的左

25、递归:S(T)|a+S|aTSTT,ST|,提取公共左因子:S(T)|aSS+S|TSTT,ST|改造后的文法已经是LL(1)文法,不带回溯的递归子程序如下:void match(token t)if(lookahead=t)lookahead=nexttoken;else error();,void S()if(lookahead=a)match(a);else if(lookahead=()match();T();,void S()if(lookahead=+)match(+);S();,void T()S();T();void T()if(lookahead=,)match(,);S()

26、;T();,3.10 已知文法GA:AaABl|aBBb|d(1)试给出与GA等价的LL(1)文法GA;(2)构造GA的LL(1)分析表;(3)给出输入串aadl#的分析过程。【解答】(1)文法GA存在左递归和回溯,故其不是LL(1)文法。要将GA改造为LL(1)文法,首先要消除文法的左递归,即将形如PP|的产生式改造为PPPP|,来消除左递归。由此,将产生式BBb|d改造为BdBBbB|其次,应通过提取公共左因子的方法来消除GA中的回溯,即将产生式AaABl|a改造为AaAAABl|最后得到改造后的文法为GA:AaAAABl|BdBBbB|,求得:FIRST(A)=a FIRST(A)=a,

27、FIRST(B)=d FIRST(B)=b,对文法开始符号A,有FOLLOW(A)=#。由AABl得FIRST(B)FOLLOW(A),即FOLLOW(A)=#,d;由AABl得FIRST(l)FOLLOW(B),即FOLLOW(B)=l;由AaA得FOLLOW(A)FOLLOW(A),即FOLLOW(A)=#,d;,由BdB得FOLLOW(B)FOLLOW(B),即FOLLOW(B)=l。对AABl来说,FIRST(A)FOLLOW(A)=a#,d=,所以文法GA为所求等价的LL(1)文法。,(2)构造预测分析表的方法如下:对文法GA的每个产生式A执行、步。对每个终结符aFIRST(A),把

28、A加入到MA,a中,其中为含有首字符a的候选式或为唯一的候选式。若FIRST(A),则对任何属于FOLLOW(A)的终结符b,将A加入到MA,b中。把所有无定义的MA,a标记上“出错”。由此得到GA的预测分析表,见表3-1。,表3-1 预测分析表,(3)输入串aadl的分析过程见表3-2。,表3-2 输入串aadl的分析过程,3.11 将下述文法改造为LL(1)文法:GV:VN|NEEV|V+ENi【解答】LL(1)文法的基本条件是不含左递归和回溯(公共左因子),而文法GV中含有回溯,所以先消除回溯,得到文法GV:G V:VNVV|EEVEE|+ENi,一个LL(1)文法的充要条件是:对每一个

29、终结符A的任何两个不同产生式A|有下面的条件成立:(1)FIRST()FIRST()=;(2)假若,则有FIRST()FOLLOW(A)=。即求出GV的FIRSTVT和LASTVT集如下:FIRST(N)=FIRST(V)=FIRST(E)=iFIRST(V)=,FIRST(E)=+,FOLLOW(V)=#,由VE得FIRST()FOLLOW(E),即FOLLOW(E)=;由VNV得FIRST(V)FOLLOW(N),即FOLLOW(N)=;由EVE得FIRST(E)FOLLOW(V),即FOLLOW(V)=#,+;由VNV得FOLLOW(V)FOLLOW(V),即FOLLOW(V)=#,+;

30、由VNV,且V得FOLLOW(V)FOLLOW(N),即FOLLOW(N)=,#,+;由EVE得FOLLOW(E)FOLLOW(E),即FOLLOW(E)=;,则,对V|E有:FIRST()FIRST(=;对E|+E有:FIRST()FIRST(+)=;对V|E有:FIRST()FOLLOW(V)=#,+=;对E|+E有:FIRST(+)FOLLOW(E)=+=。故文法GV为LL(1)文法。,3.12 对文法GE:EE+T|T TT*P|P Pi(1)构造该文法的优先关系表(不考虑语句括号#),并指出此文法是否为算符优先文法;(2)构造文法G的优先函数。,【解答】FIRSTVT集构造方法:由P

31、a或PQa,则aFIRSTVT(P)。若aFIRSTVT(Q),且PQ,则aFIRSTVT(P),也即FIRSTVT(Q)FIRSTVT(P)。由得:由EE+得FIRSTVT(E)=+;由TT*得FIRSTVT(T)=*;由Pi得FIRSTVT(P)=i。由得:由TP得FIRSTVT(P)FIRSTVT(T),即FIRSTVT(T)=*,i;由ET得FIRSTVT(T)FIRSTVT(E),即FIRSTVT(T)=+,*,i。,LASTVT集构造方法:由Pa或PaQ,则aLASTVT(P)。若aLASTVT(Q),且PQ,则aLASTVT(P),也即LASTVT(Q)LASTVT(P)。由得:

32、E+T,得LASTVT(E)=+;T*P,得LASTVT(T)=*;Pi,得LASTVT(P)=i。由得:由TP得LASTVT(P)LASTVT(T),即LASTVT(T)=*,i;由ET得LASTVT(T)LASTVT(E),即LASTVT(E)=+,*,i。,优先关系表构造方法:对Pab或PaQb,有ab;对PaR而bFIRSTVT(R),有ab;对PRb而aLASTVT(R),有ab。解之无。由得:E+T,即+FIRSTVT(T),有+*,+i;T*P,即*FIRSTVT(P),有*i。由得:EE+,即LASTVT(E)+,有+,*+,i+;TT*,即LASTVT(T)*,有*,i*。,

33、得到优先关系表见表3-3。由于该文法的任何产生式的右部都不含两个相继并列的非终结符,故属算符文法,且该文法中的任何终结符对(见优先关系表)至多满足、和三种关系之一,因而是算符优先文法。,表3-3 习题3.12的优先关系表,用关系图构造优先函数的方法是:对所有终结符a用有下脚标的fa、ga为结点名画出全部终结符所对应的结点。若存在优先关系ab或ab,则画一条从fa到ga的有向弧;若ab或ab,则画一条从g b到f a的有向弧。最后,对每个结点都赋一个数,此数等于从该结点出发所能到达的结点(包括出发结点)的个数,赋给fa的数作为f(a),赋给gb的数作为g(b)。用关系图法构造本题的优先函数,如图

34、3-7所示。得到优先函数见表3-4。,图3-7 习题3.12关系图构造,表3-4 习题3.12的优先函数表,该优先函数表经检查与优先关系表没有矛盾,故为所求优先函数。也可由定义直接构造优先函数,其方法是:对每个终结符a,令f(a)=g(a)=1;如果ab,而f(a)g(b),则令f(a)=g(b)+1;如果ab,而f(a)g(b),则令g(b)=f(a)+1;如果ab,而f(a)g(b),则令minf(a),g(b)=maxf(a),g(b)。重复上述过程,直到每个终结符的函数值不再变化为止。如果有一个函数值大于2n(n为终结符个数),则不存在优先函数。优先函数的计算过程如表3-5所示。,表3

35、-5 优先函数的计算过程表,计算最终收敛,并且计算得出的优先函数与关系图构造得出的优先函数是一样的。3.13 设有文法GS:Sa|b|(A)ASdA|S(1)构造算符优先关系表;(2)给出句型(SdSdS)的短语、简单短语、句柄、素短语和最左素短语;(3)给出输入串(adb)#的分析过程。,【解答】(1)先求文法GS的FIRSTVT集和LASTVT集:由Sa|b|(A)得FIRSTVT(S)=a,b,(;由ASd得FIRSTVT(A)=d,又由AS得FIRSTVT(S)FIRSTVT(A),即FIRSTVT(A)=d,a,b,(;由Sa|b|(A)得LASTVT(S)=a,b,);,由AdA得

36、LASTVT(A)=d,又由AS得LASTVT(S)LASTVT(A),即LASTVT(A)=d,a,b,)。构造优先关系表方法如下:对Pab或PaQb,有ab;对PaR而bFIRSTVT(R),有ab;对PRb而aFIRSTVT(R),有ab。由此得到:由S(A)得();由S(A得(FIRSTVT(A),即(d,(a,(b,(;由AdA得dFIRSTVT(A),即dd,da,db,d(;,由SA)得LASTVT(A),即d),a),b),);由ASd得LASTVT(S)d,即ad,bd,)d;此外,由#S#得#;由#FIRSTVT(S)得#a,#b,#(;由LASTVT(S)#得a#,b#,

37、)#。最后得到算符优先关系表,见表3-6。,表3-6 习题3.13的算符优先关系表,由表3-6可以看出,任何两个终结符之间至多只满足、三种优先关系之一,故GS为算符优先文法。(2)为求出句型(SdSdS)的短语、简单短语、句柄,我们先画出该句型对应的语法树,如图3-8所示。,图3-8 句型(SdSdS)的语法树,由图3-8得到:短语:S,SdS,SdSdS,(SdSdS)简单短语(即直接短语):S句柄(即最左直接短语):S可以通过分析图3-8的语法树来求素短语和最左素短语,即找出语法树中的所有相邻终结符(中间可有一个非终结符)之间的优先关系。确定优先关系的原则是:同层的优先关系为;不同层时,层

38、次离树根远者优先级高,层次离树根近者优先级低(恰好验证了优先关系表的构造算法);在句型两侧加上语句括号“#”,即#,则有#和#,由此我们得到句型(SdSdS)的优先关系如图3-9所示。,图3-9 句型(SdSdS)的优先关系,注意,句型中的素短语具有如下形式:aj-1ajaj+1aiai+1 而最左素短语就是该句型中所找到的最左边的那个素短语,即最左素短语必须具备三个条件:至少包含一个终结符(是否包含非终结符则按短语的要求确定);除自身外不得包含其他素短语(最小性);在句型中具有最左性。,因此,由图3-9得到SdS为句型(SdSdS)的素短语,它同时也是该句型的最左素短语。(3)输入串(adb

39、)#的分析过程见表3-7。,表3-7 输入串(adb)#的分析过程,为便于分析,同时给出了(adb)#的语法树,如图3-10所示。,图3-10(adb)的语法树,3.14 在算符优先分析法中,为什么要在找到最左素短语的尾时才返回来确定其对应的头,能否按扫描顺序先找到头后再找到对应的尾,为什么?【解答】设句型的一般形式为N1a1N2a2NnanNn+1。其中,每个ai都是终结符,而Ni则是可有可无的非终结符。对上述句型可以找出该句型中的所有素短语,每个素短语都具有如下形式:aj-1ajaj+1aiai+1,如果某句型得到的优先关系如下:则当从左至右扫描到第一个“”时,再由此从右至左扫描到第一个“

40、”时,它们之间(当然不包含第一个“”前一个终结符和第二个“”后一个终结符)即为最左素短语。,如果由左至右扫描到第一个“”,可以看出这并不一定是最左素短语的开头,因为由它开始并不一定是素短语(在其内部还可能包含其他更小的素短语),所以,在算符优先分析算法中,只有先找到最左素短语的尾(即“”),才返回来确定与其对应的头(即“”);而不能按扫描顺序先找到头然后再找到对应的尾。3.15 试证明在算符文法中,任何句型都不包含两个相邻的非终结符。【解答】设文法G=(VT,VN,S,),其中VT是终结符集;VN是非终结符集;为产生式集合;S是开始符号。,对句型的推导长度n作如下归纳:(1)当n=1时,S,则

41、存在一条产生式S属于,其中a(VTVN)*。由于文法是算符文法,所以中没有两个相邻非终结符,故归纳初始成立。(2)设n=k时结论成立,则对任何k+1步推导所产生的句型必为S其中,、(VTVN)*,UVN,而UV是一条产生式。,由归纳假设,U是非终结符,设=12n,=12m,其中i、j(VTVN)(1in-1,2jm);但n和m必为位于U两侧的终结符。设V=V1V2Vr,由于它是算符文法的一个产生式右部候选式,因此V1V2Vr中不会有相邻的非终结符出现。又因为nV1和Vr1中的n、1为终结符,也即在推导长度为k+1时所产生的句型12nV1V2Vr12m不会出现相邻的非终结符,故n=k+1时结论成

42、立。显然,在或为空时结论也成立。,3.16 给出文法GS:SaSbPPbPcbQc QQaa(1)它是Chomsky哪一型文法?(2)它生成的语言是什么?(3)它是不是算符优先文法?请构造算符优先关系表证实之;(4)文法GS消除左递归、提取公共左因子后是不是LL(1)文法?请证实。,【解答】(1)根据Chomsky的定义,对任何形如A的产生式,有AVN,(VTVN)*时为2型文法。而文法GS恰好满足这一要求,故为Chomsky 2型文法。(2)由文法GS可以看出:S推出串的形式是ai P bi(i0),P推出串的形式是bjQcj(j1),Q推出串的形式是ak(k1)。因此,文法GS生成的语言是

43、L=aibjakcjbi|i0,j1,k1。,(3)求出文法GS的FIRSTVT集和LASTVT集:FIRSTVT(S)=a,b FIRSTVT(P)=bFIRSTVT(Q)=aLASTVT(S)=b,c LASTVT(P)=cLASTVT(Q)=a构造优先关系表如表3-8所示。由于在优先关系中同时出现了aa和aa以及bb和bb,故文法GS不是算符优先文法。,表3-8 优先关系表,(4)消除文法GS的左递归:SaSb|PPbPc|bQcQaQQaQ|提取公共左因子后得到文法GS:SaSb|PPbPPPc|QcQaQQaQ|,求每个非终结符的FIRST集和FOLLOW集如下:FIRST(S)=a

44、,b FIRST(P)=bFIRST(P)=a,b FIRST(Q)=aFIRST(Q)=a,FOLLOW(S)=b,#FOLLOW(P)=b,c,#FOLLOW(P)=b,c,#FOLLOW(Q)=cFOLLOW(Q)=c,通过检查GS可以得到:每一个非终结符的所有候选式首符集两两不相交;存在形如A的产生式QaQ|,但有 FIRST(aQ)FOLLOW(Q)=ac=所以文法GS是LL(1)文法。,*3.17 LR分析器与优先关系分析器在识别句柄时的主要异同是什么?【解答】如果SaA且有A,则称是句型相对于非终结符A的短语。特别的,如果有A,则称是句型相对于规则A的直接短语。一个句型的最左直接

45、短语称为该句型的句柄。规范归约是关于的一个最右推导的逆过程,因此,规范归约也称最左归约。请注意句柄的“最左”特征。,LR分析器用规范归约的方法寻找句柄,其基本思想是:在规范归约的过程中,一方面记住已经归约的字符串,即记住“历史”;另一方面根据所用的产生式推测未来可能碰到的输入字符串,即对未来进行“展望”。当一串貌似句柄的符号串呈现于栈顶时,则可根据历史、展望以及现实的输入符号等三方面的材料,来确定栈顶的符号串是否构成相对某一产生式的句柄。事实上,规范归约的中心问题恰恰是如何寻找或确定一个句型的句柄。给出了寻找句柄的不同算法也就给出了不同的规范归约方法,如LR(0)、SLR(1)、LR(1)以及

46、LALR就是在归约方法上进行区别的。,算符优先分析不是规范归约,因为它只考虑了终结符之间的优先关系,而没有考虑非终结符之间的优先关系。此外,算符优先分析比规范归约要快得多,因为算符优先分析跳过了所有单非产生式所对应的归约步骤。这既是算符优先分析的优点,同时也是它的缺点,因为忽略非终结符在归约过程中的作用存在某种危险性,可能导致把本来不成句子的输入串误认为是句子,但这种缺陷容易从技术上加以弥补。为了区别于规范归约,算符优先分析中的“句柄”被称为最左素短语。,3.18 什么是规范句型的活前缀?引进它的意义何在?【解答】在讨论LR分析器时,需要定义一个重要概念,这就是文法的规范句型的“活前缀”。字的

47、前缀是指该字的任意首部,例如,字abc的前缀有、a、ab或abc。所谓活前缀,是指规范句型的一个前缀,这种前缀不含句柄之后的任何符号。之所以称为活前缀,是因为在其右边增添一些终结符号后,就可以使它成为一个规范句型。引入活前缀的意义在于它是构造LR(0)项目集规范族时必须用到的一个重要概念。,对于一个文法G,首先要构造一个NFA,它能识别G的所有活前缀,这个NFA的每个状态即为一个“项目”。文法G每一个产生式的右部添加一个圆点称为G的一个LR(0)项目(简称项目),可以使用这些项目状态构造一个NFA。我们能够把识别活前缀的NFA确定化,使之成为一个以项目集为状态的DFA,这个DFA就是建立LR分

48、析算法的基础。构成识别一个文法活前缀的DFA项目集(状态)的全体称为这个文法的LR(0)项目集归范族。,3.19 试构造下述文法的SLR(1)分析表。GS:SbASB|bA AdSa|e BcAa|c【解答】首先将文法GS拓广为GS:GS:(0)SS(1)SbASB(2)SbA,(3)AdSa(4)Ae(5)BcAa(6)Bc构造文法GS的LR(0)项目集规范族如下:I0:SS I5:AeSbASB I6:SbASBSbA BcAa,I1:SS BcI2:SbASB I7:AdSaSbA I8:SbASBAdSa I9:BcAaAe Bc,I3:SbASB AdSaSbA AeSbASB I1

49、0:AdSaSbA I11:BcAaI4:AdSa I12:BcAaSbASBSbA文法GS的DFA如图3-11所示。,图3-11 文法GS的DFA,注意,在比较熟练的情况下,也可以不构造LR(0)项目集规范族而直接画出文法GS的DFA。由于I3和I9既含有移进项目又含有归约项目,故文法GS不是LR(0)文法。我们构造文法GS的FOLLOW集如下:(1)FOLLOW(S)=#;(2)由SAS得FIRST(S)FOLLOW(A);即FOLLOW(A)=b;由SSB得FIRST(B)FOLLOW(S);即FOLLOW(S)=c;由ASa得FIRST(a)FOLLOW(S);即FOLLOW(S)=a

50、,c;,(3)由SS得FOLLOW(S)FOLLOW(S),即FOLLOW(S)=a,c,#;由SB得FOLLOW(S)FOLLOW(B),即FOLLOW(B)=a,c,#;由SA得FOLLOW(S)FOLLOW(A),即FOLLOW(A)=a,b,c,#;对I3有:bFOLLOW(S)=ba,c,#=对I9有:d,eFOLLOW(B)=d,ea,c,#=故文法GS是SLR(1)文法。最后得到SLR(1)分析表见表3-9。,表3-9 SLR(1)分析表,3.20 LR(0)、SLR(1)、LR(1)及LALR有何共同特征?它们的本质区别是什么?【解答】LR(0)、SLR(1)、LR(1)及LA

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号