当前位置:文档之家› 编译原理实验1

编译原理实验1

大学学生实验报告开课学院及实验室:年月日实验目的设计、编制并调试一个词法分析程序,加深对词法分析原理的理解。

针对表达各类词语的一组正规表达式,设计一个确定化的最简的有限自动机,对输入的符号串进行单词划分及词类识别。

实验容将词法分析器分解为以下几个部分:1.正规表达式的解析:将正规表达式中的符号分解为常量字符、正规表达式标识符和正规表达式运算符,然后基于正规表达式运算将正规表达式分解为更小的正规表达式(通过正规表达式运算符进行串接)。

2.正规表达式到NFA的转换:根据转换规则,基于正规表达式运算,将正规表达式转换为非确定有限自动机,并确定各类词的终止状态。

3.NFA的确定化:通过计算各状态的传递闭包,将NFA确定化,并确定各类词的终止状态。

4.最小化:通过子集法,求得最简的确定有限自动机,并确定各类词的终止状态。

例如:分析C语言子集的词法1)关键字main if else int return void while (都是小写)2)专用符号= + —* / < <= < >= = = != ;:,{ } [ ] ( )3)其他模式(正规表达式)STRING::=" [^"]*ID::=letter(letter|digit)*INT::=digit digit*letter::= a|…|z|A|…|Zdigit::= 0|…|94)空格由空白、制表符和换行符组成空格一般用来分隔ID、NUM、专用符号和关键字,词法分析阶段通常被忽略。

部分单词符号对应的种别码词法分析程序的功能输入:所给文法的源程序字符串输出:二元组(syn, token或sum)构成的序列。

其中syn 为单词种别码;token 为存放的单词自身字符串;sum为整型常量(作为常量的值)。

实现时,可将单词的二元组用结构进行处理代码:#include<iostream>#include<string.h>using namespace std;int main(){int i=0,j,k=0; //k判断是保留字还是idchar a[7][10] = {"main","if","else","int","return","void","while"};//保留字数组char s;char token[40] = {"\0"};cout<<"请输入字符"<<endl;s=getchar();while(s!=EOF){ //不是结束字符if(s==' '||s=='\n'||s=='\t'){ //过滤空格,换行s=getchar();}else if((s>='a'&&s<='z')||(s>='A'&&s<='Z')){//判断是id还是保留字token[i++]=s;s=getchar();while((s>='a'&&s<='z')||(s>='A'&&s<='Z')||(s>='0'&&s<='9')){//取接下来字符token[i++]=s;s=getchar();}for(j=0;j<7;j++){//判断是否为保留字if(strcmp(token,a[j])==0){cout<<j+1<<","<<token<<endl;k=1;break;}}if(k==0){//为idcout<<"10,"<<token<<endl;}memset(token,0,sizeof(token));//获取数组清零i=0;k=0;}else if(s>='0'&&s<='9'){//判断INTint flag=1;while(flag){token[i++]=s;s=getchar();if(!(s>='0'&&s<='9')){//不是数字flag=0;cout<<"20,"<<token<<endl;memset(token,0,sizeof(token));i=0;}}}else if(s=='='){//判断=s=getchar();if(s=='='){cout<<"39,=="<<endl;s=getchar();} else{cout<<"21,="<<endl;}}else if(s=='+'){//判断+cout<<"22,"<<s<<endl;s=getchar();}else if(s=='-'){//判断-cout<<"23,"<<s<<endl;s=getchar();}else if(s=='*'){//判断*cout<<"24,"<<s<<endl;s=getchar();}else if(s=='/'){//判断/cout<<"25,"<<s<<endl;s=getchar();}else if(s=='('){//判断(cout<<"26,"<<s<<endl;s=getchar();}else if(s==')'){//判断)cout<<"27,"<<s<<endl;s=getchar();}else if(s=='['){//判断[cout<<"28,"<<s<<endl;s=getchar();}else if(s==']'){//判断]cout<<"29,"<<s<<endl;s=getchar();}else if(s=='{'){//判断{cout<<"30,"<<s<<endl;s=getchar();}else if(s=='}'){//判断}cout<<"31,"<<s<<endl;s=getchar();}else if(s==','){//判断,cout<<"32,"<<s<<endl;s=getchar();}else if(s==':'){//判断:cout<<"33,"<<s<<endl;s=getchar();}else if(s==';'){//判断;cout<<"34,"<<s<<endl;s=getchar();}else if(s=='>'){//判断>或>=s=getchar();if(s=='='){cout<<"37,>="<<endl;s=getchar();} else{cout<<"35,>"<<endl;} }else if(s=='<'){//判断<或<=s=getchar();if(s=='='){cout<<"38,<="<<endl;s=getchar();} else{cout<<"36,<"<<endl;} }else if(s=='!'){s=getchar();if(s=='='){cout<<"40,!="<<endl;s=getchar();}}}}试验结果:。

相关主题