当前位置:文档之家› 编译原理词法分析报告

编译原理词法分析报告

1、实验目的1、为初等函数运算语言构造词法分析器。

2、掌握生成词法分析器的方法,加深对词法分析原理的理解。

3、掌握设计、编制并调试词法分析程序的思想和方法2、实验内容一、根据下面的要求设计初等函数运算语言的词法模式,并用正则式表达出来1、初等函数运算语言的常量为实数类型,其定义方式为实数的最一般书写方式,如:123.321。

具体要求:不支持整数部分大于。

时首数字为0;不支持小数点后结尾为0;不支持科学记数法;不支持仅为整数时有小数点;支持负数符号,不支持正数符号。

2、初等函数运算语言的变量采用与C语言的标识符定义一样的方式:首字符为字母或下划线;其他的为字母、数字及下划线的混合串;区分大小写;变量长度不超过32 个字符。

3、初等函数运算语言需要处理的函数仅为表一中所列举的内容。

函数的格式及参数内容也如表一所示。

4、初等函数运算语言支持四则运算,其计算的符号与C语言相同,为:+-*/。

5、初等函数运算语言的合法的分隔符包括:空格、制表符、、分行符圆括号(左、右)、分号。

其中空格、制表符、分行符可以出现在任何两个不同的单词中间;圆括号(左、右)用于表达式中,用于改变运算的优先级,以及标识函数的参数;分号用于标识一个语句的结束。

6、初等函数运算语言支持的常量还包括:PI,Eo其中,PI为圆周率,E为自然常数。

二、将正则式转化为最小DFA,给出该DFA的形式化表示和图形表示。

三、根据DFA给出状态转换表。

四、给出初等函数运算语言的记号表,即词法分析中,语言中的记号将分为多少类,每一类型的编码、类型、属性等内容是什么。

五、编写词法分析器,将输入的字符串转化成为记号流,便于后续的语法分析工作。

要求词法分析器中能够识别词法错误。

2.1词法模式设计/正则式分隔符compart=\t|\n|(|)|;|空格运算符:operation=+|-|*|/|=|^变量:variable=[a~zA~Z]([ a~zA~Z_0~9])*常量:constant=(ε |-)((0|(1~9)(0~9)*)(.(0~9)*(1~9)|ε ))|PI|E 2.2DFA注:id表示字母,num表示数字2.3状态转换表注:0是初态,2,6是中间状态,1,3,4,7是终态,其中1表示标示符,3,4,7是实数,8表示不合法的状态,9表示'-'为减号2.4记号表3、实验程序清单#include <iostream>#include<string>using namespace std;#define max 10char ch =' ';string key[7]={"sin","cos","tg","ctg","log","lg","ln"};//关键字char compart[6]={'\t','\n','(',')',';',' '};//分隔符char operation[5]={'+','-','*','/','='};//运算符//int s[8]={0,1,2,3,4,6,7,8};//状态集合,0 是初态,2,6 是中间状态, 1,3,4,7 是终态,其中1表示标示符,3,4,7 是实数,8 表示不合法的状态int token[23]={0,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21,22};//0 表示 sin, 1 表示 cos, 2 表示 tg,3 表示 ctg,4 表示 log, 5 表示 lg,6 表示 ln,7 表示(, 8 表示), 9 表示;, 10 表示?, 11 表示+, 12 表示-, 13 表示*, 14 表示/,15 表示=,//16 表示常量, 17 表示变量,18 表示不可识别标示符, 19 表示^,20 表示逗号, 21 表示{, 22 表示}char arr[32];int state=0;int s=0;bool tag=0;//tag=0 表示'-'为负数的负号, tag=1 表示'-'为减号FILE *fp;int IsKey(string c){ //判断是否为关键字for(int i=0;i<7;i++){if(key[i].compare(c)==0) return i;//返回下标,下标和其 token 记号一致}return -1;}bool IsLetter(char c){ //判断是否为字母if(((c<='z')&&(c>='a'))||((c<='Z')&&(c>='A')))return 1;else}bool IsNum(char c){ //判断是否为 1-9 的数字if(c>='1'&&c<='9')return 1;elsereturn 0;}bool IsUnderline(char c){ //判断是否为下划线if(c=='_')return 1;elsereturn 0;}void move(char ch,int s){//在状态 s 接收字符 ch 后,移动的新状态switch(s){case 0:{if(ch=='_'||IsLetter(ch)) state= 1;else{if(ch=='0')state=3;elseif(IsNum(ch))state=4;elseif(ch=='-')state=2;elsebreak;}case 1:{if(IsNum(ch)||ch=='_'||IsLetter(ch)||ch=='0') state=1;elseif(ch=='-')state=9;elsestate=8;break;}case 2:{if(ch=='0')if(IsNum(ch)) state=4;elsestate=8; break;}case 3:{if(ch=='.') state=6;elseif(ch=='-') state=9;elsestate=8; break;{if(IsNum(ch)||ch=='0') state=4;elseif(ch=='-')state=9;elseif(ch=='.')state=6;elsestate=8;break;}case 6:{if(ch=='0')elseif(IsNum(ch)) state=7;elsestate=8; break;}case 7:{if(ch=='0') state=6;elseif(IsNum(ch)) state=7;elseif(ch=='-') state=9;state=8;break;}case 8:{if(ch=='-')state=9;elsestate=8;break;}}//switch}void judge(char arr[]){if(s==3||s==4||s==7)cout<<"("<<arr<<" "<<token[16]<<")"<<endl; //常量{if(s==1){if(!strcmp(arr,"PI")||!strcmp(arr,"E"))cout<<"("<<arr<<" "<<token[16]<<")"<<endl; //常量else{if(IsKey(arr)==-1)cout<<"("<<arr<<" "<<token[17]<<")"<<endl; //普通标示符elsecout<<"("<<arr<<" "<<IsKey(arr)<<")"<<endl; //关键字}}elseif(s==9)cout<<"("<<arr<<" "<<token[12]<<")"<<endl;//减号if(s==8)cout<<"("<<arr<<" "<<token[18]<<")"<<endl; //不可识别标示符标示符}switch(ch){case'+':cout<<"("<<ch<<" "<<token[11]<<")"<<endl;break;//运算符case'*' :cout<<"("<<ch<<" "<<token[13]<<")"<<endl;break;//运算符case'=' :cout<<"("<<ch<<" "<<token[15]<<")"<<endl;break;//运算符case'/' :cout<<"("<<ch<<" "<<token[14]<<")"<<endl;break;//运算符case'^':cout<<"("<<ch<<" "<<token[19]<<")"<<endl;break;//运算符case'(' :cout<<"("<<ch<<" "<<token[7]<<")"<<endl;break;//分隔符case')' :cout<<"("<<ch<<" "<<token[8]<<")"<<endl;break;//分隔符case';' :cout<<"("<<ch<<" "<<token[9]<<")"<<endl;break;//分隔符case',' :cout<<"("<<ch<<" "<<token[20]<<")"<<endl;break;//分隔符case'{' :cout<<"("<<ch<<" "<<token[21]<<")"<<endl;break;//分隔符case'}' :cout<<"("<<ch<<" "<<token[22]<<")"<<endl;break;//分隔符case'?':cout<<"("<<ch<<" "<<token[10]<<")"<<endl;break;//运算开始符case' ':case'/t':case'/n':{ }}}void analyse(FILE*fp){int i=0;while(ch!='EOF'){char arr[32]={'\0'};while(ch!='('&&ch!=')'&&ch!=''&&ch!='\t'&&ch!='\n'&&ch!='{'&&ch!='}'&&ch!=','&&ch!='?'&&ch!='-'&&ch!='^'&&ch!=';'&&ch!='+'&&ch!='*'&&ch!='/'&&ch!='='&&ch!='EOF') {if (i<32){arr[i]=ch;move(ch,s);s=state;}i++;}//whilejudge(arr);if(ch=='-'){char arr[32]={'\0'};i=0;while(ch!='('&&ch!=')'&&ch!=''&&ch!='\t'&&ch!='\n'&&ch!='{'&&ch!='}'&&ch!=','&&ch!='?'&&ch!='^'&&ch!=';'&&ch!='+'&&ch!='*'&&ch!='/'&&ch!='='&&ch!='EOF') {move(ch,s);s=state;arr[i]=ch;if(state!=9){i++;ch=fgetc(fp);else{ //s=9 为减号时char arr[32]={'\0'}; break;}}//whilejudge(arr);s=0;i=0;ch=fgetc(fp);}else{char arr[32]={'\0'}; ch=fgetc(fp);i=0;s=0;}//while}void main(){char in_fn[30];FILE * fp;cout<<"请输入源文件名(包括路径和后缀名) :";for(;;){cin>>in_fn;if((fp=fopen(in_fn,"r"))!=NULL)//意思是文件指针 fpin 在调用 fopen 打开文件如果失败,则会成为一个空指针!break; //文件顺利打开后,指向该流的文件指针就会被返回。

相关主题