当前位置:文档之家› 编译原理词法分析程序实验报告记录

编译原理词法分析程序实验报告记录

编译原理词法分析程序实验报告记录————————————————————————————————作者:————————————————————————————————日期:编译原理实验报告实验名称:编写词法分析程序实验类型:设计性实验指导教师:*****专业班级:软件工程1401姓名:****学号:**********实验地点:东六E座301实验成绩:_________________日期:2016 年5 月8 日实验一编写词法分析程序一、实验目的1.通过设计、调试词法分析程序,掌握词法分析程序的设计工具(有穷自动机),进一步理解自动机理论2.掌握正则文法和正则表达式转换成有穷自动机的方法及有穷自动机实现的方法3.确定词法分析程序的输出形式及标识符与关键字的区分方法4.加深对理论知识的理解二、实验设计1.设计原理:对源程序代码从头到尾扫描,将符合词法语言规则的单词输出,包括:标识符、保留字、无符号整数、分界符、运算符、注释分离;判断程序的词法是否正确TEST语言的词法规则如下:1)、标识符:字母打头,后接任意字母或数字。

2)、保留字:标识符的子集,包括:if,else,for,while,do, int,write,read。

3)、无符号整数:由数字组成,但最高位不能为0,允许一位的0。

4)、分界符:(、)、;、{、}5)、运算符:+、-、*、/、=、<、>、>=、<=、!=、==6)、注释符:/* */2.设计方法:1)用正则表达式或正则文法描述程序设计语言的词法规则,通常采用正则表达式;一个正则表达式对应一条词法规则2)为每个正则表达式构造一个NFA,用来识别正则表达式描述的单词将每一个NFA合并、化简得到最简的DFA3)将多个NFA合并为一个NFA4)将NFA转换成等价的DFA。

5)最小化DFA6)确定单词的输出形式。

7)化简后的DFA+单词输出形式⇒构造词法分析程序3.设计过程:1)将TEST语言的六个语法规则分别转换成正则表达式2)为每个正则表达式构造一个NFA,用来识别正则表达式描述的单词3)将5个NFA转换成一个NFA,再将NFA化简确定化。

4.设计结果:1)每一条TEST语言对应的正则表达式如下:标识符:( a|b|……|z|A|B……|Z )( 0|1|……|9| a|b|……|z|A|B……|Z )*保留字:标识符的子集无符号整数:( (1……|9 )( 0|1|……|9)* )|0分界符:( | ) | ; | { | }运算符:+ | - | * | / | = | < | > | >= | <= | != | ==注释符:/*(其他)*/2)NFA如图3)化简、确定化的DFA三、实验过程1.将TEST语言的六个语法规则转换成正则表达式2.将每个正则表达式装换成NFA,再将NFA合并化简3.最终得到设计结果如上所示:4.根据确定化的DFA编写代码5.测试实验数据三、实验结果1.测试数据:{/*This a test program.*/int abc;int 123;int A$@;int i;int n;int b,c;int 2a;int a2;read n;n = 012345;for (i=1;i<=n; i= i+1){abc=abc+i;}if(i!=n) n = n+i;if (!n) b = b+c;/*The loop endedwrite abc;}2.实验现象:a)控制台显示的数据:b)输出文本的数据:{ {int intID abc; ;int intNUM 123; ;int intID AError $Error @; ;ID i; ;int intID n; ;int intID bError ,ID c; ;int intNUM 2ID a; ;int intID a2; ;read r eadID n; ;ID n= =NUM 0 NUM 12345 ; ;for for( (ID i= =NUM 1; ;ID i<= <=; ;ID i= =ID i+ + NUM 1 ) ) { {ID abc = =ID abc + +ID i; ;} }if if ( (ID i!= !=ID n) )ID n= =ID n+ +ID i; ;if if ( ( Error ! ID n) )ID bID b+ +ID c; ;c)数据分析:根据TEST语法规则,我们可以知道int A$@;这一句中的$和@是不合法的int b,c;这一句中的逗号是不合法的if (!n) b = b+c;这一句中!是不合法的/*The loop ended 这一句都是不合法的四、讨论与分析单词分类方法:按照标识符、数字、分解符、注释符、运算符分类;其中需要注意的是(>|<=)可以直接结束,也可以连接=,!必须与=连接才合法,对于/需要多重考虑,即在注释这个部分也可能是/符号构建词法分析程序的一般过程:、1、根据词法规则写出正则文法或者正则文法。

2、为每一个正则表达式构造一个NFA,然后将多个NFA合并为一个NFA3、将NFA转化成DFA,并且化简最小化DFA4、确定单词的输出形式5、根据化简后的DFA和单词输出程序构造词法分析程序五、附录:关键代码//开始读取文件中的字符ch = getc(fin);while(ch != EOF){i = 0;while(ch == ' ' || ch == '\n' || ch == '\t'){if(ch == '\n')line ++;ch = getc(fin);}//标识符处理if(isalpha(ch)){while(isalpha(ch) || isdigit(ch)){buff[i++] = ch;ch = getc(fin);}buff[i] = '\0';//保留字int n = 0;while((n < 8) && strcmp(buff,keyword[n])) n++;if(n < 8)fprintf(fout,"%s\t%s\n",buff);elsefprintf(fout,"%s\t%s\n","ID",buff);}//数字处理else if(isdigit(ch)){//单个数字“0”if(ch == '0'){buff[0] = ch;buff[1] = '\0';fprintf(fout,"%s\t%s\n","NUM",buff);ch = getc(fin);}//数字的组合else{while(isdigit(ch)){buff[i++] = ch;ch = getc(fin);}buff[i] = '\0';fprintf(fout,"%s\t%s\n","NUM",buff);}}//单分界符else if(strchr(singleword,ch) > 0){buff[0] = ch;buff[1] = '\0';ch = getc(fin);fprintf(fout,"%s\t%s\n",buff,buff);}//双分界符else if(strchr(doubleword,ch) > 0){buff[0] = ch;ch = getc(fin);if(ch == '='){buff[1] = ch;buff[2] = '\0';ch = getc(fin);fprintf(fout,"%s\t%s\n",buff,buff);}else{buff[1] = '\0';if(buff[0] == '!'){printf("Line %d\t%s\t%s\n",line,"错误:",buff);fprintf(fout,"%s\t%s\n","Error",buff);}else{fprintf(fout,"%s\t%s\n",buff,buff);}}}//注释else if(ch == '/'){ch = getc(fin);if(ch == '*'){char ch1 = getc(fin);while(true){if(ch1 == EOF){printf("Line %d\t%s\t没有匹配!\n", line,"错误:" );break;}ch = ch1;ch1 = getc(fin);if(ch =='*' && ch1 == '/')break;}ch = getc(fin);}else{buff[0] = '/';buff[1] = '\0';//输出单分界符'/'fprintf(fout,"%s\t%s\n",buff,buff);}}else{buff[0] = ch;buff[1] = '\0';flag = 3;ch = getc(fin);printf("Line %d\t%s\t%s\n", line, "错误:", buff);fprintf(fout,"%s\t%s\n","Error",buff);}}fclose(fin);fclose(fout);return flag;}。

相关主题