编译原理第四章语法分析-自上而下分析.ppt

上传人:牧羊曲112 文档编号:6599846 上传时间:2023-11-16 格式:PPT 页数:34 大小:220.16KB
返回 下载 相关 举报
编译原理第四章语法分析-自上而下分析.ppt_第1页
第1页 / 共34页
编译原理第四章语法分析-自上而下分析.ppt_第2页
第2页 / 共34页
编译原理第四章语法分析-自上而下分析.ppt_第3页
第3页 / 共34页
编译原理第四章语法分析-自上而下分析.ppt_第4页
第4页 / 共34页
编译原理第四章语法分析-自上而下分析.ppt_第5页
第5页 / 共34页
点击查看更多>>
资源描述

《编译原理第四章语法分析-自上而下分析.ppt》由会员分享,可在线阅读,更多相关《编译原理第四章语法分析-自上而下分析.ppt(34页珍藏版)》请在三一办公上搜索。

1、第四章 语法分析-自上而下分析,4.1 语法分析器的功能4.2 自上而下分析面临的问题4.3 LL(1)分析法4.4 递归下降分析程序构造4.5 预测分析程序4.6 LL(1)分析中的错误处理,4.1 语法分析器的功能,功能定义:按照文法产生式,识别输入符号串是否为一个句子。技术路线:是否能从文法的开始符号出发推导出这个输入串。或者,建立一颗与输入串相匹配的语法分析树。策略:自上而下分析法,自下而上分析法。,图4.1 语法分析器在编译程序中的地位,接收词法分析器输出的记号串,检查是否合乎语法。报告语法错误,并恢复语法错误,从而可以继续分析。输出是分析树的某种形式。分析时其它任务:将各种记号的信

2、息收入符号表、类型检查和其它语义检查、中间代码的生成,这些放在“前端的其它部分”完成。,4.2 自上而下分析面临的问题,例4.1 假定有文法(1)SxAy(2)A*|*对输入串x*y,构造语法树。构造过程:(1)把S作为根(2)用S的产生式构造子树(3)让输入串指示器IP指向输入串的第一个符号。,(4)调整输入串指示器IP与叶结点进行匹配。(5)如果为非终结符,用A的下一个产生式构建子树。(6)如果匹配成功则结束;否则,回溯到步骤(4)。,自上而下分析法的缺点:是文法的左递归性问题。一个文法是含有左递归的自上而下的分析过程陷入无限循环。如PP。由于有回溯,就会产生一大堆麻烦事情。在上述的自上而

3、下分析过程中,当一个非终结符用某一候选匹配成功时,这种成功可能仅是暂时的。这种虚假现象,我们需要更复杂的回溯技术。一般说,要消除虚假匹配是很困难的。当最终报告分析不成功时,我们不知道输入串中出错的确切位置。,4.3 LL(1)分析法,4.3.1 左递归的消除 4.3.2 消除回溯、提左因子 4.3.3 LL(1)分析条件,左递归的消除,一个简单例子:已知文法:PP|是一个左递归文法,它的等价的非左递归文法为:P P P P|例2.2一般转换规则有:PP1|P2|Pm|1|2|n改写成P1P|2P|nPP1P|2P|mP|其中:i都不以P开头,I不等于,一个反例:文法:SQc|c;QRb|b;R

4、Sa|a虽然不是直接左递归,但S、Q、R都是左递归。消除左递归算法:算法的思想是:首先构造直接左递归;再利用一般转换规则,消除直接左递归化简文法。下面算法在不含PP,也不含在右部产生式时可以消除左递归。,消除一个文法的左递归算法:(1)把文法G的所有非终结符按任一种顺利排列成P1Pn;按此顺序执行;(2)FOR i:=1 TO n DOBEGINFOR j:=1 TO i-1 DO把形如Pj+1Pj 的规则改写成Pj+11|1|k|。其中Pj1|1|k是关于Pj的所有规则;消除关于Pi规则的直接左递归性。END 化简由()所得的文法。即去除那些从开始符号出发永远无法到达的非终结符的产生规则。,

5、例子4.3:对4.3文法,它的非终结符排序为R,Q,S。把R代入Q,Q代入S得到:SSabc|abc|bc|c消除左递归后得到:SabcS|bcS|cSSabcS|QSab|ab|b(化简消去)RSa|a(化简后消去)对不同的排列,会有不同形式的无左递归文法,但它们等价。,4.3.2 消除回溯、提左因子,消除回溯的思路:对输入符号a,指派一个A的候选式1与a匹配,而再没有其他候选式i的字符与a匹配。通过提取公共左因子,判断首字符集的差异。首字符集定义:对G的所有非终结符的每个候选,它的首字符集为 FIRST()=a|a,aVT,若*,则规定 FIRST()。,提取公共左因子算法:A1|2|n|

6、1|2|m(其中每个 不以开头)那么可以把这些规则改写成:AA|1|2|m A1|2|n例4.4上述算法的不足:当非终结符A面临输入符号a,且a不属于A的任意候选首符集,但A的某个候选首符集包含时,就一定可以使A自动匹配。这是一种错误。,4.3.3 LL(1)分析条件,定义FOLLOW(A)集合:假定S是文法G的开始符号,对于G的任何非终结符A,我们定义FOLLOW(A)=a|S*Aa,aVT 若S*A,则规定FOLLOW(A)。LL(1)文法的充分必要条件:文法不含左递归。若1|2|n,则FIRST(i)FIRST(j)=(ij)对文法中的每个非终结符A,若它存在某个候选首符集包含,则FIR

7、ST(A)FOLLOW(A)=,LL(1)匹配算法:对输入符号a,A的所有产生式为:1|2|n(1)若aFIRST(i),则指派I去执行匹配任务。(2)若a不属于任何一个候选首符集,则:FIRST(i)且aFOLLOW(A),则让A(i)与(a)自动匹配;否则,a的出现是一种语法错误。例 4.4,4.4 递归下降分析程序构造,递归下降分析器:这个分析程序由一组递归过程组成的,每个过程对应文法的一个非终结符。ETEE+TE|TFTT*FT|F(E)|i,PROCEDURE E PROCEDURE TBEGIN BEGIN T;E F;TEND ENDPROCEDURE E PROCEDURE T

8、IF SYM=THEN IF SYM=THENBEGIN BEGIN ADVANCE;ADVANCE;T;E F;TEND END,PROCEDURE F IF SYM=iTHEN ADVANCE ELSE IF SYM=(THEN BEGIN ADVANCE;E;IF SYM=)THEN ADVANCE ELSE ERROR END ELSE ERROR;,扩展巴科斯范式(Backus Naur Form):用花括号表示闭包运算*。用n0表示可任意重复次至n次,000=。用方括号表示0,即表示的出现可有可无,等价于|。,例4.5:文法ET|E+TT F|T*FF i|(E)可表示成E T+T

9、F F*FF(E)|I,4.5 预测分析程序,4.5.1 预测分析程序工作过程 4.5.2 预测分析表的构造,预测分析器思想:,栈,表4.1 文法4.2的LL(1)分析表,预测分析程序的总控程序:其具体工作过程是首先把文法开始符号和#压入栈,然后总控程序在任何时候都是按STACK栈顶符号X和当前输入符号a行事的,如图所示。对于任何(X,a),总控程序每次都执行下述三种可能的动作之一:若X=a,则宣布分析成功,停止分析过程。若X=a,则把X从STACK栈顶逐出,让a(指示器)指向下一个输入符号。若X是一个非终结符,则查看分析表M。若MA,a中存放着关于X的一个产生式,则X出栈,把X产生式右部符号

10、串按反序压栈,如果MA,a中存放出错标志,则调用诊断程序。,预测分析程序的总控程序描述是:BEGIN 首先把然后把文法开始符号推进STACK栈;把第一个输入符号读进a;FLAG:=TRUE;WHILE FLAG DOBEGIN 把STACK栈顶符号上托出并放在X中;IF XVT THEN IF X=a THEN 把下一输入符号读进a ELSE ERROR ELSE IF X=#THEN IF X=a THEN FLAG:=FALSE ELSE ERROR,ELSE IF MA,a=XX1X2XkTHEN 把Xk,Xk-1,X1一一推进STACK栈/*若X1X2Xk=,不推任何字进栈*/ELSE

11、 ERROREND OF WHILE;STOP/*分析成功,过程完毕*/END,例4.6:输入串为i1*i2+i3,利用分析表进行预测分析的步骤步骤 符号栈 输入串 所用产生式0#E i1*i2+i3#1#ET i1*i2+i3#ETE2#ETF i1*i2+i3#TFT3#ETi i1*i2+i3#Fi4#ET*i2+i3#5#ETF*i2+i3#T*FT 15#E#T 16#E,4.5.2 预测分析表的构造,FIRST(X)集的构造算法:若XVT,则FIRST(X)X。若XVn,且有产生式Xa,则把a加入到FIRST(X)中;若X 也是一条产生式,则把也加到FIRST(X)中。若XY是一个

12、产生式,且YVn,则把FIRST(Y)中所有非-元素都加到FIRST(X)中;若XY1Yi-1是一个产生式且YVn,且对任何的j(1ji-1),FIRST(Yj)都含有(即Y1Yi-1*)则把FIRST(Yj)中的所有非-元素都加到FIRST(X)中;特别地,若FIRST(Yj)都含有,把 加入FIRST(X)中重复以上操作,直到FIRST(X)不再增大为止。上述算法可以推广到FIRST(),=X1Xk,非终结符B的FOLLOW(B)构造算法:对于文法的开始符号S,置于FOLLOW(B)中;若AB是一个产生式,则把FIRST()-加至FOLLOW(B)中;若AB是一个产生式,或AB是一个产生式

13、而(即FIRST()),则把FOLLOW(A)加至FOLLOW(B)中。,构造分析表M的算法:(1)对文法G的每个产生式A执行第步和第步;(2)对每个终结符aFIRST(),把A加至MA,a中;(3)若FIRST(),则对任何bfollow(A)把()加至MA,b中;(4)把所有无定义的MA,a标上“出错标志”例4.7、4.8,4.6 LL(1)分析中的错误处理,错误类型:栈顶的终结符与当前的输入符号不匹配。非终结符A处于栈顶,面临的输入符号为a,但分析表M中的MA,a为空。错误处理方法:跳过输入串中的一些符号直至遇到“同步符号”为止。,同步符号集合的选择方法:把FLLOWO(A)加入A的同步活动集。把FIRST(A)加入到A的同步活动集。直接弹出站顶元素,并发送信息告知插入下一个终结符后,继续分析。,例4.9:,表4.2 加入同步符号的LL(1)分析表,表4.3 对)id*+i的语法分析与错误处理,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号