编译原理4语法分析.ppt

上传人:牧羊曲112 文档编号:6016549 上传时间:2023-09-15 格式:PPT 页数:74 大小:500.50KB
返回 下载 相关 举报
编译原理4语法分析.ppt_第1页
第1页 / 共74页
编译原理4语法分析.ppt_第2页
第2页 / 共74页
编译原理4语法分析.ppt_第3页
第3页 / 共74页
编译原理4语法分析.ppt_第4页
第4页 / 共74页
编译原理4语法分析.ppt_第5页
第5页 / 共74页
点击查看更多>>
资源描述

《编译原理4语法分析.ppt》由会员分享,可在线阅读,更多相关《编译原理4语法分析.ppt(74页珍藏版)》请在三一办公上搜索。

1、第四章 语法分析,4.1语法分析程序的功能语法分析:逐一分析词法分析所得的属性字,检查其中的语法错误,如果没有发现语法错误,则给出正确的语法结构。语法分析常用方法:1、自顶向下分析方法,2、自底向上分析方法。所谓的自顶向下分析法就是从文法的开始符号出发,根据文法规则正向推导出给定句子的方法;或者说,从树根开始,往下构造语法树,直到建立每个树叶的分析方法。自底向上分析方法是从给定的输入串开始,根据文法规则逐步进行归约,直至归约到文法的开始符号;或者说,从语法树的末端开始,步步向上归约,直至根结点的分析方法。,4.2自顶向下分析法非确定的自顶向下分析法的思想对任何输入串w试图用一切可能的办法,从文

2、法的开始符号出发,自上向下地为它建立一棵语法树。或者说,为输入串寻找一个最左推导。如果试探成功,则w为相应文法的一个句子,否则w就不是文法的句子。这种分析过程本质上是一种穷举试探过程,是反复使用不同规则,谋求匹配输入串的过程。例:设有文法GS SaAb,A de|d,判断adb是否为该文法的句子。自顶向下分析的难点:对于形如:U x1|x2|xn 的规则,可能需要对所有的规则都要试探,效率很低。故常使用确定的自顶向下分析法,但确定的自顶向下分析法对文法有一定的限制,既是要求文法无左递归和无回溯。,文法的左递归和回溯的消除1.左递归的消除(1)引进一个新的非终结符,把含左递归的规则改写为右递归,

3、一般地,对于含有左递归规则的文法GA:A A1|A 2|A m|1|2|n 消除左递归规则后的文法为:A 1A|2A|nA A 1A|2A|mA|,例:E E+T|E-T|T T TF|T/F|F F(E)|i,E TEE+TE|-TE|T FTT*FT|/FT|F(E)|i,(2)扩充的BNF表示法1)专用符号:扩充的BNF又引进了三对专用符号。花括号:表示符号串可以重复出现任意次。使用可以消除规则的左递归现象的出现。例:N ND|D D 0|1|2|9用扩充的BNF可以表示为:N DDD 0|1|2|9方括号:表示符号串可有可无圆括号():()表示提因子。例:A ax|ay|aw 改写为:

4、A a(x|y|w)。,2)扩充的BNF表示法的用途例:设有文法GE:E T|E+TT F|T*F F i|(E)用扩充的BNF法可改写为:E T+TT FFF i|(E)扩充的BNF表示法最大特点就是消除了文法的左递归问题。,E T+T|-TT FF|/FF i|(E),例:设有文法A Ac|Aad|bd|e,用扩充的BNF表示法对其改写,A(bd|e)c|ad,2.回溯的消除引起回溯的原因:在文法中某个非终结符A有多个候选式,遇到用A去匹配当前输入符号时,无法确定选用唯一的一个候选式,而只能逐一进行试探,从而引起回溯。具体表现为两种情况:第一种情况是相同左部的规则,其右部左端第一个符号相同

5、。SaAb,A de|d,对于adb第二种情况是相同左部的规则,其中某一右部能推出。ABx,B x|,对于x,常用的符号集有三种:首符号集:FIRST;向前看集:FOLLOW;可选集:SELECT。(1)设是文法G的任一符号串,定义符号串的首符号集为:FIRST()=a|a,a Vt 若,则规定 FIRST(),既FIRST()是从可以推导出的所有首终结符或可能的。(2)设文法G的开始符号为S,对于G的任何非终结符A,定义非终结符A的向前看集FOLLOW(A)=a|S Aa,aVt若有S A,则规定$FOLLOW(A),换句话说FOLLOW(A)是文法的所有句型中紧接在A之后出现的终结符或$,

6、$作为输入串的结束符。(3)设有文法GS,并有规则A,AVN,V*,则该规则的可选集为:SELECT(A)=,FIRST()若,FIRST()FOLLOW(A)若,一个上下文无关文法G是LL(1)文法,并且仅当对G中每个非终结符A的任何两个不同的规则A|,满足SELECT(A)SELECT(A)=,其中,中至多只有一个能推出串。例:判断下列文法是否为LL(1)文法1.SaAb,A de|d2.A aB|d,B bBA|3.SaAB,A bB|dA|,B a|e某些非LL(1)文法到LL(1)文法的改写若文法中含有左递归或含有公共左因子,则该文法不是LL(1)文法,因此对于某些非LL(1)文法来

7、说,可以通过消除左递归和反复提取公共左因子对文法进行等价变换,将其改造为LL(1)文法。,提取公共因子:当文法中含有形如A1|2|n的规则,可将它改写成AAA 1|2|n若在1,2,n中仍含有公共左因子,这时可再次提取,这样反复进行提取,直到引进新的非终结符的有关规则再无公共左因子为止。例:将下例文法改写为LL(1)文法,并验证之。1.SaAb,A de|d2.Sad|Ae,A aS|bA,对于文法S Ae|Bd,A aAe|b,B aBd|b,递归下降分析法基本思想:对文法中的每个非终结符编写一个函数(或子程序),每个函数(或子程序)的功能是识别由该非终结符所表示的语法成分。由于描述语言的文

8、法常常是递归定义的,因此相应的这组函数(或子程序)必然以相互递归的方式进行调用,所以将此种分析法称为递归下降分析法。构造递归下降分析程序时,每个函数名是相应的非终结符,函数体则是根据规则右部符号串的结构编写。1)当遇到终结符a时,则编写语句if(当前读来的输入符号=a)读下一个输入符号。2)当遇到非终结符A时,则编写语句调用A()。3)当遇到A 规则时,则编写语句if(当前读来的输入符号FOLLOW(A)error()。4)当某个非终结符的规则有多个候选式时,按LL(1)文法的条件能唯一地选择一个候选式进行推导。,例:设有文法GS:S a|(T)T T,S|S试构造一个识别该文法句子的递归下降

9、分析程序。设函数scaner()的功能是读进源程序的下一个单词符号并把它放在全局变量sym中;函数error()是出错处理程序。,4.2.5 LL(1)分析方法(预测分析法)LL(1)分析方法也是一种自顶向下的分析技术。第一个L表示采用从左到右扫描程序,第二个L表明采用最左推导,1表示分析时每一步只需向前看一个符号即可决定所选用的规则,且这种选择是准确无误的。采用这种方法进行语法分析要求描述语言的文法是LL(1)文法。预测分析器由一张预测分析表(也称LL(1)分析表)、一个先进后出的分析栈和总控程序三部分组成。,Sk,Tj,预测分析表是一个MA,a形式的矩阵,其中A为非终结符,a是终结符或$,

10、分析表元素MA,a中的内容为一条关于A的规则,表明当A面临输入符号a时,当前推导所应采用的候选式,当元素的内容为出错标识时,则表明A不应该面临输入符号a。预测分析器的总控程序在任何时候都是根据栈顶符号和当前符号a来决定分析器的动作。分析器工作流程可简单表示为:1.初始化。分析开始时,首先将栈底符号$及文法的开始符号S推入分析栈,并对各指示器置初值,此时分析栈与输入串有如下格局:之后反复执行下面的第二步。2.设在分析的某一时刻,分析栈和余留的输入串处于如下的格局:,时可视分析栈顶的文法符号Xm的不同情况,分别作如下处理:(1)若XmVT$,且Xm=ai,则表明栈顶符号已与当前正扫视的输入符号(包

11、括句尾符号$在内)相匹配,此时应将Xm从栈中退出,并将输入串指示器向前推进一个位置,否则进行语法错误处理;(2)若XmVn,则以符号对(Xm,ai)查分析表,设元素AXm,ai为产生式Xm Y1 Y2 Yk,则将Xm从栈中退出,并将Y1 Y2 Yk按反序推入栈中,从而产生如下格局:但若AXm,ai为“出错”,则进行语法错误处理。,(3)若Xm=ai=$(即分析栈将被拆空),则表明输入串已完全得到匹配,此时可宣告分析成功而结束工作。,构造预测分析表的算法(1)计算文法G的每一个非终结符的FIRST集和FOLLOW集。1)对每一文法符号X(VNVT),计算FIRST(X):a.若X VT,则FIR

12、ST(X)=X;b.若XVN,且有规则Xa,a VT,则a FIRST(X);c.若XVN,且有规则X,FIRST(X);d.若XY是一个产生式且YVN,则把FIRST(Y)中的所有非元素都加到FIRST(X)中;若有规则Xy1y2yn,对于任意的i(1i n),当y1y2yi-1都是非终结符,且y1y2yi-1 时,则将FIRST(yi)中的所有非元素都加到FIRST(X)中,特别是,若y1y2yn,则 FIRST(X)。e.反复使用a-d,直到FIRST集不再增大为止。,2)对每一文法符号AVN,计算FOLLOW(A):a.对文法的开始符号S,则将$加到FOLLOW(S)中;b.若A B是

13、一条规则,则把FIRST()中的非元素加到FOLLOW(B)中;c.若A B 或A B是一条规则且,则把FOLLOW(A)加到FOLLOW(B)中;d.反复使用b-c直到每个非终结符的FOLLOW集不再增大为止。(2)对文法的每个规则A,若a FIRST(),则置MA,a=A。(3)若 FIRST(),则对任何b FOLLOW(A),则MA,b=A。(4)把分析表中无定义的元素标上出错标识error(表中用空白表示)P67 例4.10,4.3自下向上分析法的一般原理自下向上分析法是按照移进归约法的原理建立起来的一种语法分析方法,这种分析法的基本思想是:用一个寄存文法符号的先进后出的栈,将输入符

14、号一个一个地按从左到右扫描顺序移入栈中,边移入边分析,当栈顶符号串形成某条规则右部时就进行一次归约,即用该规则左部非终结符替换相应规则右部符号串,我们把栈顶被归约的这一符号串称为可归约串。重复这一过程直到整个输入串分析完毕。最终若栈中剩下句子界符“$”和文法的开始符号,则所分析的输入符号串是文法的正确句子,否则,就不是文法正确的句子,报告错误。例:设有文法GA:AaBcDe,B b,B Bb,D d,实现自下而上分析法的关键问题是如何精确定义可归约串,以及怎样识别可归约串,4.4算符优先分析法方法概述所谓的算符优先分析法就是依照算术表达式的四则运算过程而设计的一种语法分析方法,这种方法首先要规

15、定运算符之间(确切的说是终结符之间)的优先关系和结合性质,然后借助这种关系,比较相邻运算符的优先级来确定句型的可归约串,并进行归约。例:E E+E|E*E|(E)|i对于句子i+i*i有两种不同的规范归约。第一种:i+i*i E+i*i E+E*i E+E*E E+E E 第二种:i+i*i E+i*i E+E*i E*i E*E E问题原因:没有定义+和*的优先关系,在第一种规范归约中是假定*优先于+,所以不能立即把E+E归约为E,而在第二种归约中是假定+优先于*,因此必须把E+E归约为E。可见在归约过程中起决定因素的是相邻两个终结符号的优先关系。,任意两个相邻终结符号a和b之间的优先关系有

16、三种:ab a的优先级大于b优先关系与出现的左右次序有关:a a一个文法的终结符号之间的优先关系可用一个矩阵来表示,矩阵的每一行每一列都是文法的终结符,矩阵元素是两个终结符之间可能的优先关系。算符优先分析法并不是对所有的文法都适合,他对文法有一定的要求,即要求文法是算符优先文法。,算符优先文法的定义1.算符文法的定义设有文法G,若G中没有形如U VW的规则,其中V、W为非终结符,则称G为算符文法,也称OG文法。也就是说在算符文法中任何一个规则右部都不存在两个非终结符相邻的情况。算符文法有两个重要性质:1)在算符文法中任何句型都不含有两个相邻的非终结符。2)若Ab或bA出现在算符文法的句型中,其

17、中AVN,b VT,则中任何含有b的短语必含有A.,算符优先关系表的构造首先对文法每个非终结符A定义两个集合:FIRSTVT(A)=b|A b或A Bb,bVT,B VNLASTVT(A)=a|A a或A aB,aVT,B VN构造文法G的优先关系表算法如下:1)为每个非终结符A计算FIRSTVT(A)和LASTVT(A)。2)执行程序for(每个产生式Ax1x2xn)for(i=1;i=n-1;i+)if(xiVT且Xi+1 VT)置xi Xi+1;if(i=n-2且xiVT且Xi+2 VT,而Xi+1 VN)置xi Xi+2;,if(xiVT,Xi+1 VN)for(FIRSTVT(Xi+

18、1)中的每个b)置xi xi+1;3)对FIRSTVT(S)中的所有b置$;置$,S为文法的开始符号例:设有文法:GEE E+T|TT TF|FF(E)|i,算符优先分析算法的设计算术优先分析法并不是一种规范归约的分析法,它不是用句柄来刻画可归约串,而是用最左素短语来刻画可归约串。1.最左素短语所谓句型的素短语是指这样一种短语,它至少包含一个终结符,并且除自身之外,不再包含其他的素短语。句型最左边的素短语称为最左素短语。如上例对句型T+T*F+i求其素短语和最左素短语。2.识别句型最左素短语的方法由算符文法的性质可知,算符优先文法的任何句型都没有相邻的两个非终结符,其句型总可以表示成$N1a1

19、N2a2NnanNn+1$,其中Ni为非终结符或空,ai为终结符(1i n),对算符优先文法有如下定理:一个算符优先文法G的任何句型的最左素短语是满足下列条件的最左子串NiaiNi+1ai+1ajNj+1ai-1 aj+1具体方法是:从左到右扫描句型中的各个符号,且在扫描过程中,依次查看两相继终结符号间的优先关系,直至找出满足关系aj aj+1的终结符aj为止,记下aj的位置,再从aj开始向左扫描,直至找到满足关系ai-1 ai的终结符ai为止,此时形如NiaiNi+1ai+1ajNj+1的子串即为句型应归约的最左素短语。,3.算符优先分析法用一个存放文法符号的先进后出的栈,并利用优先关系确定

20、最左素短语是否已经形成来决定分析器的动作,如果当前栈顶的终结符号和待输入符号之间的优先关系是,则表示已找到最左素短语的尾,再从栈顶开始,按优先关系在栈内向前寻找最左素短语的头,然后分析器将归约最左素短语,如果出现两个终结符号之间不存在优先关系,则表示存在语法错误,分析器调用出错处理程序。算法:设K为栈的使用深度,a用来存放当前输入符号,j是栈的查找指针,Q是工作单元,则算法流程图如下:,在算法中没有指明应将栈顶的最左素短语归约到哪一个非终结符N,这是因为非终结符在分析过程中对识别最左素短语没有任何影响,因此可以不关心非终结符到底是哪一个具体符号,故可取任意的名字N来代替它们。分析成功的标志是栈

21、中仅剩下$N.优先函数的构造1.优先函数f和g的定义当ab则令f(a)g(b)我们把f和g分别称为栈内优先函数和栈外优先函数。这样a和b之间的优先关系可以由比较f(a)和g(b)的大小来决定。,2.优先函数的构造方法方法一:逐次加1法1)确定初值,对所有的终结符(包括$)a,令f(a)=g(a)=0(可为其它任意正数)2)对所有终结符a和b如果ab,而f(a)g(b),则令f(a)=g(b)+1如果a b,而f(a)g(b),则令g(b)=f(a)+1如果a b,而f(a)g(b),则令f(a)=g(b)=max(f(a),g(b)3)重复执行2)直到过程收敛。重复过程中若f(a)或g(b)的

22、值大于2n(n为终结符个数)则表明该函数关系表不存在优先函数。对优先函数每个元素的值都增加同一常数,仍为原优先关系表的优先函数,即一个文法的优先关系表对应的优先函数不唯一,当然有一些优先关系表不存在对应的优先函数。,方法二:Bell有向图法1)对每个终结符a(包括$),令其对应两个符号fa和ga,画一张以所有符号fa和ga为结点的方向图,若ab或a b,就要画一条从fa到gb的方向弧;若ab或a b,就要画一条从gb到fa的方向弧。2)对每个结点都赋予一个数,此数等于从该点出发所能到达的结点(包括该结点自身在内)的个数,赋给结点fa的数等于fa的值,赋给结点gb的数等于gb的值。3)对构造出的

23、优先函数f和g进行检查,看他们同原先的优先关系表是否矛盾,若没有矛盾,则f和g既为所求优先函数,否则不存在优先函数。,4.5 LR分析方法所谓LR(K)方法:是指从左到右扫描和自底向上的语法分析方法。L是指从左到右扫描输入符号串,R是指构造最右推导的逆过程,K指最多向前看K个符号就可惟一确定是归约还是移进。LR(K)理论证明:1)每个LR(K)文法都是无二义性文法2)一个由LR(K)文法产生的语言也可由LR(1)文法产生。而且通常的程序设计语言一般都能由LR(1)文法产生,因此对程序设计语言的编译,我们仅需要考虑K1的情况即可。4.5.1 LR分析器的原理和过程LR分析法确定句柄的基本思想:在

24、规范归约分析过程中,根据分析栈中记录的已移进和归约的整个符号串(即历史)和使用的规则推测未来可能遇到的输入符号(即展望),以及现实读到的输入符号这三方面的信息来确定分析栈栈顶的符号串是否构成句柄。一个LR分析器的结构示意图如下:,分析栈用来存放分析过程中的历史和展望信息。LR分析法将历史和展望信息抽象成状态,并放在分析栈中,这就是说分析栈中的每个状态概括了从分析开始到某一归约阶段的整个分析历史和对未来进行的展望。,LR分析表是LR分析法的核心,一张LR分析表由分析动作表(ACTION)和状态转换表(GOTO)组成。分析动作表,分析动作表元素ACTIONSi,a规定了当状态Si面临符号a(a为文

25、法的全部终结符和句子界符$)时应当执行的动作,有四种可能的动作:1)移进:把状态Sj=ACTIONSi,a和输入符号a移入分析栈。2)归约:当栈顶符号串形成句柄,且文法中有A 的规则,其中|=,则归约动作是从分析栈栈顶去掉个文法符号和个状态,并把归约符A和GOTO Si-,A=Sj移入分析栈。,3)接受(acc):表示分析成功。此时,分析栈中只剩下文法开始符号S和当前读到的输入符号$,即输入符号串已经结束。4)报错:表示输入串含有错误,此时出现栈顶的某一状态遇到了不该遇到的输入符号。,动作转换表,状态转换表GotoSi,x规定了当状态Si遇到文法符号x(x为文法的全部符号)时应转移到的下一个状

26、态。为了节省存储空间,通常把两个表重叠,即把当前状态下面临终结符的下一个状态与分析动作表的移进动作用数组元素表示。,总控程序也称为驱动程序,对所有的LR分析器总控程序是相同的,其过程如下:,1.分析开始时,首先将初始状态S0及句子界符$推入分析栈。2.设在分析的某一步,分析栈和余留输入符号串处于如下格局:则用当前栈顶的状态Sm及正扫视的输入符号ai组成的符号对(Sm,ai)去查分析动作表,并根据分析表元素ACTIONSm,ai 的指示采取相应的分析动作,每一分析表元素所指示的仅能是下列动作之一:,1)若ACTIONSm,ai=“移进”,则表明句柄尚未在栈顶部形成,正期待继续移进输入符号以形成句

27、柄,故将当前输入符号ai推入栈中,即然后,以符号对(Sm,ai)去查状态转移表,设相应的表元素GOTOSm,ai=Sm+1,再将此新的状态Sm+1(即要转移到的下一个状态)推入栈中,则有如下格局:,2)若ACTIONSm,ai=rj其中rj意指按文法的第j个产生式A Xm-r+1Xm-r+2 Xm进行规约。这表明栈顶的符号串Xm-r+1Xm-r+2 Xm已是当前的句型的句柄,按第j个产生式进行规约,也就是将分析栈从顶向下的r个符号和r个状态退出,然后将文法符号A进栈,此时分析栈格局为然后再以(Sm-r,A)去查状态转移表,设GOTOSm-r,A=Sk,再将此新的状态推入栈中,则有如下格局:,3

28、)若ACTIONSm,ai=“接受”,则表明当前的输入串已被成功地分析完毕,应终止分析工作。4)若ACTIONSm,ai=“ERROR”,则表明当前的输入串中有语法错误,应该调用出错处理程序进行处理。3.重复步骤2的工作,直到在分析的某一步,栈顶出现“接受”状态为止。此时,分析栈的最终格局应为其中Z为文法的开始符号,Sz为使ACTIONSz,$=“接受”的唯一状态。,用稍微程序化的写法可描述为:初始化(初始状态S0在分析栈栈顶,输入串的第一个符号读入a);while(ACTIONS,a!=acc)if(ACTIONS,a=Si)将状态Si和输入符号a进栈;将下一个输入符号读入a;else if

29、(ACTIONS,a=rj)用第j条规则A 归约;将|个状态和|个输入符号退栈:当前栈顶状态为S,将A和GOTOS,A=S进栈;else if(ACTIONS,a=ERROR)error();,例:设有文法0.S S1.S A2.S B3.A aAb4.A c5.B aBb6.B d,对aacbb$进行分析,4.5.2 LR(0)分析法LR(0)根据当前分析栈顶状态确定应完成何种分析动作。LR分析器的关键部分是分析表的构造。构造LR分析表的的基本思想是从给定的上下文无关文法直接构造识别文法所有规范句型活前缀的DFA,然后将DFA转换成一张LR分析表。一、几个基本概念1.文法规范句型的活前缀1)

30、字符串的前缀是指字符串的任意首部。例:字符串abc的前缀有、a、ab、abc2)规范句型的活前缀是指规范句型的前缀,这种前缀不包含句柄右边的任何符号。若是含句柄的活前缀,并且每个句柄都是的后端,则称是可归前缀或可规范前缀。,例:设有文法GSSS S CbBA A Aab A abB c B Db C a D a对于句子ababab有规范推导:S S CbBA CbBab CbDbab Cbabab ababab,2.LR(0)项目活前缀与句柄之间的关系有三种:1)活前缀中已含有句柄的全部符号,表明此时某一规则A的右部符号串已经出现在栈顶,其相应的分析动作是用此规则规归约。2)活前缀只含有句柄的

31、一部分符号,此时意味着形如A12规则的右部子串1已经出现在栈顶,正期待着从剩余的输入串中进行归约得到2。3)活前缀全然不含有句柄的任何符号,此时意味着期望从剩余的输入串中能看到有某一规则A的右部所推出的符号串。,为了刻画在分析过程中,文法的一个规则右部符号串已有多大一部分被识别,我们可在文法中每个规则右部适当位置加上一个圆点来表示。针对上面三种情况,标有圆点的规则分别为:AA1 2A我们把文法G中右部标有圆点的规则称为G的一个项目。对于空规则A仅有项目A。一个LR(0)项目指明了对文法规范句型活前缀的不同识别状态,文法G的全部LR(0)项目是构造识别文法所有规范句型活前缀的DFA的基础。,由于

32、不同的LR(0)项目反映了在分析过程中栈顶的不同情况,因此根据圆点的位置和圆点后是终结符还是非终结符,将一个文法全部LR(0)项目进行分类:1)规约项目,形如A,其中(VT VN)*,既圆点在最右端的项目,他表示一个规则的右部已分析完,句柄已形成,应该按此规则进行归约。2)移进项目,形如Aa,其中,(VT VN)*,a VT,既圆点后为终结符的项目,他表示期待从输入串中移进一个符号,以待形成句柄。3)待约项目,形如AB,其中,(VT VN)*,B VN,既圆点后为非终结符的项目,他表示期待从剩余的输入串中进行归约而得到B,然后才能继续分析A的右部。4)接受项目,形如SS,其中S为文法的开始符号

33、,既文法开始符号的归约项目。S为左部的规则仅有一个,他是归约项目的特殊情况,他表示整个句子已经分析完毕,可以接受。,3.项目集:构成识别文法规范句型活前缀的DFA的每一个状态是由若干个LR(0)项目所组成的集合,称为LR(0)项目集。4.项目集的相容性定义:满足下列两个条件的项目集称为相容的项目集:)无移进项目和归约项目并存对于项目集:Aa,B 对于栈顶元素,我们无法确定是进行移进还是归约。)无多个归约项目并存对于项目集:A,B 对于栈顶元素,我们无法确定是把它归约到A还是B。,二、构造识别文法所有规范句型活前缀的DFA的方法可以利用闭包函数(CLOSURE)来求DFA一个状态的项目集。为了使

34、“接受”项目唯一,我们可对文法G进行拓广。假定文法G的开始符号为S,在文法G中引入一个新的开始符号S,并引进规则S,S,从而得到文法G的拓广文法G,。1)定义闭包函数设I是拓广文法G,的一个LR(0)项目集,定义和构造I的闭包CLOSURE(I)如下:I中的任何一个项目都属于CLOSURE(I)若AB属于CLOSURE(I),则每一形如Br的项目也属于CLOSURE(I)重复直到CLOSURE(I)不在增大为止。例:设有文法GS:0、SS1、SA2、SB3、AaAb4、Ac5、BaBa6、Bd求SS的闭包函数。,2)定义状态转移函数GO设I是拓广文法G,的一个LR(0)项目集,X为一文法符号,

35、定义状态转移函数GO(I,X)如下:GO(I,X)=CLOSURE(J)J=AX|AXI3)构造识别文法规范句型活前缀的DFA的方法求CLOSURE(S,S),得到初态项目集。对初态项目集或其他已构造的项目集,应用转移函数GO(I,X)求出新的项目集(后继状态)。重复直到不再出现新的项目集(新状态)为止。转移函数GO建立状态之间的连接关系。构成识别一个文法活前缀的DFA的状态(项目集)的全体称为这个文法的LR(0)项目集规范族。,4)LR(0)分析表的构造若对于一个文法G的拓广文法G,的LR(0)项目集规范族的每个项目集,不存在移进项目和规约项目同时并存或多个规约项同时共存,则称G为LR(0)

36、文法。对LR(0)文法构造LR(0)分析表算法如下:用整数0,1,2,n分别表示状态I0,I1,I2,In,令包含S,S项目的集合Ik 的下标k为分析器的初态若项目Ax属于Ik,且转换函数GO(Ik,x)=Ij,当x为终结符时,则置ACTIONk,x=Sj若项目A属于Ik,则对任何终结符和$(统一记为a)置ACTIONk,a=rj,(假定A 为文法第j条规则)若GO(Ik,A)=Ij,A为非终结符,则置 GOTOk,A=j若项目S,S属于Ik,则置ACTIONk,$=acc 分析表中凡不能用规则至填入信息的元素均置为“出错标志”,为了使分析表清晰,仅使用空白表示出错标志。,例:设有文法GS:1

37、、SA2、SB3、AaAb4、Ac5、BaBb6、Bd为了处理方便,我们给上述文法引入一个新的开始符号S,且定义:SS 作为第0个产生式,从而得到原来的文法的拓广文法GS:0、SS1、SA2、SB3、AaAb4、Ac5、BaBb6、Bd,4.5.3 SLR(1)分析法例:文法GEE E+T|TT T*F|FF(E)|i将文法进行拓广并编号:(0)SE(1)E E+T(2)E T(3)T T*F(4)T F(5)F(E)(6)F i得到如下DFA和分析表,为了对句子进行确定性分析,需要解决移进归约或归约归约冲突,我们采用对含有冲突的项目集向前查看一个输入符号的办法来解决冲突,这种分析法称为简单的

38、LR分析法,即SLR(1)分析法。出现问题的原因:LR分析表构造算法的第二条,即对于每个项目集IK中的归约项目A,不管当前输入符号是什么,都将ACTION表中第K行的各个元素均置rj,其中j为规则A 的编号,因此假设有如下项目集:IK=X bB,A,Br在分析表第K行中遇到输入符号b时,必然会出现多重定义元素。解决办法:向前查看一个输入符号以考察当前所处的环境,对归约项目A 和Br,只需考察将句柄或 r归约为A或B时,直接跟在A或B后的终结符的集合即FOLLOW(A)和FOLLOW(B)互不相交且不包含移进符号b,即满足:,FOLLOW(A)FOLLOW(B)=FOLLOW(A)b=FOLLO

39、W(B)b=那么当状态K面临输入符号aVT$时,可以按照以下规则解决冲突:1)a=b,则移进。2)a FOLLOW(A),则用规则A 进行归约。3)a FOLLOW(B),则用规则Br进行归约。4)此外报错。,一般而言,若一个LR(0)项目集I中有m个移进项目和n个归约项目时:I:A 1 a11,A 2 a22,A m amm,B1r1,B2r2,Bnrn对于所有的移进项目向前看一符号集合a1,a2,am和FOLLOW(B1),FOLLOW(B2),FOLLOW(Bn)两两相交为时,则项目集I中冲突仍可用下述规则解决冲突。对当前输入符号aVT$:1)a a1,a2,am,则移进。2)a FOL

40、LOW(Bi),i=1,2,3则用规则Biri进行归约。3)此外报错。这种用来解决分析动作冲突的方法称为SLR(1)方法。如果对于一个文法的某些LR(0)项目集或LR(0)分析表所含有的动作冲突都能用SLR(1)方法解决,则称这个文法是SLR(1)文法。,SLR(1)分析表的构造与LR(0)分析表的构造基本相同,仅对LR(0)分析表的构造算法中的规则2进行如下修改:若项目A属于Ik,则对任何终结符a FOLLOW(A),置ACTIONk,a=rj,(假定A 为文法第j条规则),4.5.4 LR(1)分析法,例:有拓广文法0、SS1、SL=R 2、SR3、L*R4、Li5、RL,L,一个事实:如

41、果栈里的符号串为$,规约后变为$,当读到的输入符号是a,若文法中不存在以a为前缀的规范句型,那么这种归约无效。对上例针对句型i=i的SLR(1)分析过程为:S S L=R L=L L=i i=i状态栈 符号栈 输入串0$i=i$05$i=i$02$L=i$03$R=i$当状态2呈现于栈顶且面临的输入符号是=时,由于这个文法不含有以R=为前缀的规范句型,因此用RL进行的归约是无效归约,也就是说并不是FOLLOW(R)的每个元素在含R的所有句型中都会出现在R的后面.解决这一问题的方法是采用LR(1)分析法.,LR(1)分析法的思想是在分析过程中,当试图用某一规则A归约栈顶的符号串时,不仅应该查看栈

42、中符号串,还应向前扫视一个输入符号a,只有当a的确构成文法某一规范句型的前缀时,才能用此规则进行归约。为此可以考虑在原来LR(0)项目集中增加更多的展望信息,这些信息有助于克服动作冲突和排除无效归约。也就是需要重新定义称之为LR(1)的项目。一个LR(1)项目是一个二元组A,a,其中A是一个LR(0)项目,每个a是终结符且aFollow(A),称为展望符或搜索符。当时,搜索符是无意义的;当=时,搜索符a明确指出当A,a是栈顶状态的一个LR(1)项目时,仅在输入符号是a时才能用A归约,而不是对FOLLOW(A)中的所有符号都用A归约。,构造LR(1)项目集族的方法:(1)构造LR(1)项目集I的

43、闭包函数I的任何项目都属于CLOSURE(I)若项目AB,a,属于CLOSURE(I),Br是文法的一条规则,bFIRST(a),则Br,b也属于CLOSURE(I)重复直到CLOSURE(I)不在增大为止。,(2)构造转换函数令I是一个LR(1)项目集,X是一个文法符号,函数GO(I,X)=CLOSURE(J)J=AX,a|AX,aI(3)构造DFA同LR(0)分析法相同(注:构造初态是从基本项目SS,$开始的)(4)构造LR(1)分析表的方法与构造LR(0)分析表的方法基本相同,仅对归约项目作如下修改:若归约项目A,a属于Ik,则对搜索符a置ACTIONk,a=rj,(假定A 为文法第j条

44、规则),2.5.5 LALR(1)分析法,LALR(1)分析法是界于SLR(1)和LR(1)分析法之间的一种语法分析方法,这种分析法能解决SLR(1)分析法所不能解决的冲突动作,并且其分析表的状态个数与SLR(1)相同。LALR(1)分析法的基本思想是将LR(1)项目集规范族中所有同心的项目集合并为一,以减少项目集个数。所谓同心的LR(1)项目集是指在两个LR(1)项目集中,除搜索符不同之外,核心部分相同。,I4:L*R,=/$R L,=/$L*R,=/$L i,=/$I5:L i,=/$I12:L i,$I7:L*R,=/$I13 L*R,$I8:RL,=/$I10:R L,$将同心集合并为

45、(合并时核心部分保持不变,仅搜索符合并):I 4,11:L*R,=/$I 5,12:L i,=/$R L,=/$I 7,13:L*R,=/$L*R,=/$I 8,10:RL,=/$L i,=/$,I11:L*R,$R L,$L*R,$L i,$,对合并同心集后的项目集的转换函数为GO(I,X)自身的合并,这是因为相同心的转换函数仍属同心集。GO(I4,11,i)=GO(I4,i)GO(I11,i)=I5 I12=I5,12GO(I4,11,R)=GO(I4,R)GO(I11,R)=I7 I13=I7,13GO(I4,11,*)=GO(I4,*)GO(I11,*)=I4 I11=I4,11对于L

46、ALR(1)项目集族,有以下若干事实:1.尽管原来各LR(1)项目集均不存在冲突,但合并同心集后就有可能出现冲突,但由此引入的冲突只能是归约归约冲突,决不会是移进归约冲突。Ik:A,W1 Ij:A,W2 Aa,b Aa,c设Ik与Ij均无冲突故有:W1a=,W2a=从而(W1W2)a=将Ik与Ij合并,有Ik,j:A,W1W2 Aa,bc 若有移进归约冲突,则有(W1W2)a与假设矛盾,故仅有归约归约冲突。,2.对一给定文法而言,其LALR(1)分析表比LR(1)分析表状态要少3.在分析文法G的某一个含有错误的符号时,LALR(1)分析速度比LR(1)分析速度慢。构造LALR(1)分析表的方法:1)构造拓广文法G,的LR(1)项目集族2)若LR(1)项目集族不含冲突的项目集,则合并所有同心集构造出文法的LALR(1)项目集族3)若LALR(1)项目集族中不存在归约归约冲突,则该文法是LALR(1)文法4)LALR(1)项目集族构造该文法的LALR(1)分析表的方法与LR(1)分析表的构造方法相同。,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号