《编译原理课程设计C语言编译器的实现.doc》由会员分享,可在线阅读,更多相关《编译原理课程设计C语言编译器的实现.doc(45页珍藏版)》请在三一办公上搜索。
1、扬州大学编译原理课程设计 学 号: 091202122 姓 名: 专 业: 计算机科学与技术 课 程: 编译原理 指导教师: 陈宏建 目录一程序简介与分析-3二程序适用范围-3三词法分析-3四语法分析-4五语义分析和中间代码生成-10六代码生成-12七流程图-13八实现-14九程序运行结果-14十总结-18十一.附录(源程序)-18 简单的编译程序设计一 程序简介与分析本程序由四个部分组成:词法分析子程序,语法分析子程序,语义分析子程序,目标代码生成程序。本程序输入一个叫libo.txt的c语言源程序,然后对它进行词法,语法,语义分析,并输出汇编代码。词法分析输入的是c语言源程序,输出的3是具
2、有独立语法意义的单词符号。语法分析以词法分析产生的编码流为输入,按照SLR(1)分析方法进行语法分析,产生语法树,输出移进和归约的动作,如果源程序不符合文法,则有“语法分析出错”的提示。语义分析阶段,在语法分析的同时,在归约的时候,给出相应的语义动作,最后输出中间代码四元式和新的符号表,如果有未声明的变量出现,则会提示出出错,并显示出此变量的名称。代码生成阶段,将语义分析得到的中间代码四元式转化为汇编语言的目标代码并输出。二 程序适用范围 本程序的使用范围为:整型常量,四则运算(为了简化问题,本程序只考虑加法运算和乘法运算)和布尔表达式以及相应的赋值语句,条件转移语句和循环语句。三 词法分析根
3、据词法分析的需要,我将源程序中的单词符号分为:保留字,字母(标识符),界符三类,统一用一张表表示如下:界符,保留字表单词=+*:;()andifthenwhiledoint标志符编码1234567891031323335363725程序从源程序文件libo.txt中一次读入一个字符,并判断它是不是字母,界符,保留字,空格,换行,结束符号或者非法字符。流程图如下: 词法分析流程图四 语法分析源程序中涉及的文法GP定义如下表:说明语句表达式布尔表达式句法0、PP1、Pid () L;R2、LL;D3、LD4、Did:int5、EE+T6、ET7、TT*F8、TF9、F(E)10、Fid11、BB
4、and B12、Bidid13、Mid=E14、Sif B then M15、Swhile B do M16、SM17、NN;S18、NS19、RN.上述文法的每个非终结符的FIRST 集和FOLLOW集如下表: FIRST 集 FOLLOW 集P id # L id ; D id ; E (,id ,;,+,),#T (,id ,;,+,),*,#F (,id ,;,+,),*,#B id then,do,andM id ,; S id,while,if ,; N id,while,if ,; R # .文法GP的项目集部分如下:0. P.P 1. PP.2. P.id()L;R 3. Pi
5、d.()L;R 4. Pid(.)L;R 5. Pid().L;R 6. Pid()L.;R 7. Pid()L;.R 8. Pid()L;R. 9. L.L;D10.LL.;D 11. LL;.D 12. LL;D. 13.D.id:int 14. Did .:int 15. Did: .int 16. Did:int. 17.E.E+T 18. EE.+T 19. EE+.T 20. EE+T. 21. E.T 22. ET. 23. T.T*F 24. TT.*F 25. TT*.F 26. TT*F. 27. T.F 28. TF. 29. F (E) 30. F (.E) 31. F
6、 (E.) 32. F (E). 33. F.id 34. Fid. .再由项目集构造文法的DFA活前缀。为了方便,省去了项目族集的每个状态的项目,直接在状态转换的箭头上标明终结符或非终结符。对于有规约动作和接受的状态,将其特别标明。文法GP的DFA图如下: 有归约动作812765 : int 说明语句接受状态 D id D id3021491011R ; L ) ( id P26252423 if B then M271430292028191718222113 id and id 句法S id = if idM N ; S id M while while B do M id and353
7、431 id B 布尔表达式 and3233 id1536 T id38 id ( F E3716 * (403941 F ( id F id + E ( 表达式4342 + ) T4445 *GP:SLR(1)分析表Actiongotoid();:*+=intandifthenwhiledo$PDRETFBMSLN012345678910111213141516170123456789100s211acc2s33s44s5895s66s77r48r39s1010s5s13121111r112r213s14s23s2722211714s1515s36s4116383716r13s43r1317
8、s19s1818r1919s14s23s272220GP:SLR(1)分析表Actiongotoid();:*+=intandifthenwhiledo$PDRETFBMSLN0123456789101112131415161701234567891020r17r1721r18r1822r16r1623s312424s34s2525s142626r14r1427s312828s3429s14s293030r15r1531s3232s3333r12r12r1234s313535r11r11r1136r10r10r10r10r1037r8r8r8r8r838r6r6s39r6r639s36s414
9、0GP:SLR(1)分析表actiongotoid();:*+=intandifthenwhiledo$PDRETFBMSLN0123456789101112131415161701234567891040r7r7r7r7r741s36s4142383742s45s4343s36s41443744r5r5s39r5r545r9r9r9r9r9五 语义分析和中间代码生成载语法分析过程中,随着分析的步步进展,根据每个产生式所对应的语义子程序(或语义规则描述的语义动作)进行翻译的办法称作语法制导翻译。语法制导翻译归约动作翻译方案EE+TEE1+TE.place=newtemp;Emit(E.plac
10、e:=E1.place+T.place);ETET E.place:=T.place;TT*FTT1*FT.place=newtemp; Emit(T.place:= T1.place+F.place);TFTF T.place:=F.place;F(E)F(E)F.place:=E.place;FidFid p:=lookup(id.name); if pnil then F.place:=p else error;BB and BBB1 and A B2backpatch(B1.truelist,A.quad);B.truelist:=B2.truelist;B.falselist:=me
11、rge(B1.falselist,B2.falselist);AA.quad:=nextquadBididBid1id2B.truelist:=makelist(nextquad); B.falselist:=makelist(nextquad+1); emit(if id1.placeid2.placegoto_ _); emit(goto_ _);Mid=EMid=E p:=lookup(id.name); if pnil then emit(p:=E.place) else error;Sif B then MSif B then A Mbackpatch(B.truelist,A.qu
12、ad) backpatch(B.falselist,nextquad)AA.quad:=nextquadSwhile B do MSwhile A1 B do A2 M backpatch(B.truelist,A2.quad) backpatch(B.falselist,nextquad+1) emit(gotoA1.quad)A1A1.quad:=nextquadA2A2.quad:=nextquad语法翻译生成的四元式如下:六 代码生成目标代码生成阶段的任务是把中间代码变换成特定机器上的绝对指令代码或可重定位的指令代码或汇编指令代码。这是编译的最后阶段,它的工作与硬件系统结构和指令含义有
13、关,这个阶段的工作很复杂,涉及到硬件系统功能部件的运用、机器指令的选择、各种数据类型变量的存储空间分配以及寄存器和后缓寄存器的调度等。本程序生成的目标代码与0x8086微处理器兼容。下面列举几个简单的四元式与汇编代码的转化列子:(+,A,B,T)MOV R ,A ;ADD R ,B ;ST R , T. ( *, A , B , T ) MOV R ,A ;MUL R ,B ;ST R , T. ( J, _ , _ , L) JMP L. ( J , A , B , L ) MOV R , A CMP R , B JB L. ( =,A , _ ,T ) LD R , A ST R , T
14、本程序生成的目标代码如下: 七 程序流程图 编译程序流程图 八 实现本程序运行的硬件环境为CPU1.66HZ ,内存为768M .软件环境为windows xp系统,Visual C+环境。九 程序运行结果1 输入源文件路径:2 输出保留字 3输出符号表的内容5输出语法分析的结果(本程序采用自下而上的LR语法分析)6输出中间代码7输出目标代码十 总结通过本次实验,我对编译程序各阶段有了更深刻更深入的了解,也纠正了自己在某些方面的的错误,丰富了自己关于编译原理方面的知识。同时也培养了自己热爱思考,勤查资料的习惯。由于水平本次实验涉及面并不是很全面,我只考虑了c语言的一个子集。当然本程序的算法在某
15、些地方也还存在一些缺陷。十一 附录(源程序)本程序输入的c源代码如下:libo()a:int;b:int;ccc:int;d:int;if cccb and ccca then a=b+a;while cccd do a=d;a=(b+ccc)*a+d本程序的完整源代码如下:#include#include#include#include#include#includeusing namespace std;struct token/词法 token结构体int code;/编码int num;/递增编号token *next;token *token_head,*token_tail;/to
16、ken队列struct str/词法 string结构体int num;/编号string word;/字符串内容str *next;str *string_head,*string_tail;/string队列struct ivan/语法 产生式结构体char left;/产生式的左部string right;/产生式的右部int len;/产生式右部的长度;ivan css20;/语法 20个产生式struct pank/语法 action表结构体char sr;/移进或归约int state;/转到的状态编号;pank action4618;/action表int go_to4611;/
17、语法 go_to表struct ike/语法 分析栈结构体,双链ike *pre;int num;/状态int word;/符号编码ike *next;ike *stack_head,*stack_tail;/分析栈首尾指针struct L/语义四元式的数据结构int k;string op;/操作符string op1;/操作数string op2;/操作数string result;/结果L *next;/语义四元式向后指针L *Ltrue;/回填true链向前指针L *Lfalse;/回填false链向前指针;L *L_four_head,*L_four_tail,*L_true_hea
18、d,*L_false_head;/*四元式链,true链,false链*/struct symb/语义输入时符号表string word;/变量名称int addr;/变量地址symb *next;symb *symb_head,*symb_tail;/语义符号链表/词法分析有关函数声明void outdaima() ;void scan();/按字符读取源文件void cifa_main();/词法分析主程序int judge(char ch);/判断输入字符的类型void out1(char ch);/写入token.txtvoid out3(char ch,string word);/写
19、入string.txtvoid input1(token *temp);/插入结点到队列tokenvoid input3(str *temp);/插入结点到队列stringvoid output();/输出三个队列的内容void outfile();/输出三个队列的内容到相应文件中/语法分析有关函数声明void yufa_main();/语法分析主程序void yufa_initialize();/初始化语法分析数据结构int yufa_SLR1(int a);/语法分析主体部分int ID1(int a);/给输入字符编号,转化成action表列编号string ID10(int i);/给
20、输入字符反编号int ID2(char ch);/给非终结状态编号,转化成go_to表列编号int ID20(char ch);/给非终结状态编号char ID21(int j);/给非终结状态反编号void add(ike *temp);/给ike分析栈链表增加一个结点void del();/给ike分析栈链表删除一个结点/语义分析相关函数的声明void yuyi_main(int m);/语义分析主程序void add_L_four(L *temp);/向四元式链中加一个结点void add_L_true(L *temp);/向true链中加一个结点void add_L_false(L *
21、temp);/向false链中加一个结点void add_symb(symb *temp);/向语义符号表链中加一个结点void output_yuyi();/输出中间代码四元式和最后符号表string newop(int m);/把数字变成字符串string id_numtoname(int num);/把编号转换成相应的变量名int lookup(string m);/变量声明检查/全局变量的声明FILE *fp;/文件指针int wordcount;/标志符计数int err;/标志词法分析结果正确或错误int nl;/读取行数int yuyi_linshi;/语义临时变量string
22、E_name,T_name,F_name,M_name,id_name,id1_name,id2_name,errword;/用于归约时名称传递和未声明变量的输出int id_num,id1_num,id2_num,id_left,id_while,id_then,id_do;/用于记录一些特殊的字符位置信息/主程序开始int main()cout*endl;cout* 说明: *endl;cout* 第一部分:词法分析 *endl;cout* 第二部分:语法分析 *endl;cout* 第三部分:语义分析 *endl;cout* 第四部分:目标代码生成 *endl;cout*endl;cif
23、a_main();/词法yufa_main();/语法output_yuyi();/语义 outdaima(); /代码生成coutnext=NULL;token_tail=new token;token_tail-next=NULL;string_head=new str;string_head-next=NULL;string_tail=new str;string_tail-next=NULL;/初始化三个队列的首尾指针L_four_head=new L;L_four_head-next=NULL;L_four_tail=new L;L_four_tail-k=0;L_four_tail
24、-next=NULL;L_true_head=new L;L_true_head-Ltrue=NULL;L_false_head=new L;L_false_head-Lfalse=NULL;symb_head=new symb;symb_head-next=NULL;symb_tail=new symb;symb_tail-next=NULL;yuyi_linshi=-1;id_num=0;wordcount=0;/初始化字符计数器err=0;/初始化词法分析错误标志nl=1;/初始化读取行数scan();if(err=0)char m;output();cout词法分析正确完成!endlendlm;coutendl;if(m=y)outfile();cout