数学与软件科学学院实验报告学期:13至14__ 第_2 学期 2014年3月17 日课程名称:编译原理专业:2011级5_班实验编号:01 实验项目:词法分析器指导教师_王开端姓名:张世镪学号: 2011060566 实验成绩:一、目的学习编译原理,词法分析是编译的第一个阶段,其任务是从左至右挨个字符地对源程序进行扫描,产生一个个单词符号,把字符串形式的源程序改造成单词符号串形式的中间程序。
执行词法分析的程序称为词法分析程序,也称为词法分析器或扫描器。
词法分析器的功能是输入源程序,输出单词符号做一个关于C的词法分析器,C++实现二、任务及要求1.词法分析器产生下述C的单词序列这个C的所有的单词符号,以及它们的种别编码和内部值如下表:-* / & <<=>>===!= && || , : ; { } [ ] ( )ID和NUM的正规定义式为:ID→letter(letter | didit)*NUM→digit digit*letter→a | … | z | A | … | Zdigit→ 0 | … | 9如果关键字、标识符和常数之间没有确定的算符或界符作间隔,则至少用一个空格作间隔。
空格由空白、制表符和换行符组成。
三、大概设计1. 设计原理词法分析的任务:从左至右逐个字符地对源程序进行扫描,产生一个个单词符号。
理论基础:有限自动机、正规文法、正规式词法分析器又称扫描器:执行词法分析的程序2. 词法分析器的功能和输出形式功能:输入源程序、输出单词符号程序语言的单词符号一般分为以下五种:关键字、标识符、常数、运算符、界符。
3. 输出的单词符号的表示形式:(单词种别,单词符号的属性值) 单词种别用整数编码,关键字一字一种,标识符统归为一种,常数一种,各种符号各一种。
4. 状态转换图实现三、程序设计1. 词法分析器的流程图2. 总体模块设计/*用来存储目标文件名*/ string file_name;/*提取文本文件中的信息。
*/string GetText();/*获得一个单词符号,从位置i开始查找。
//并且有一个引用参数j,用来返回这个单词最后一个字符在str的位置。
*/string GetWord(string str,int i,int& j);/*这个函数用来除去字符串中连续的空格和换行int DeleteNull(string str,int i);/*判断i当前所指的字符是否为一个分界符,是的话返回真,反之假*/bool IsBoundary(string str,int i);/*判断i当前所指的字符是否为一个运算符,是的话返回真,反之假*/bool IsOperation(string str,int i);/*此函数将一个pair数组输出到一个文件中*/void OutFile(vector<pair<int,string> > v);/*此函数接受一个字符串数组,对它进行词法分析,返回一个pair型数组*/vector<pair<int,string> > analyst(vector<string> vec);/*此函数判断传递的参数是否为关键字,是的话,返回真,反之返回假*/bool IsKey(string str);4. 各模块设计1.首先根据上面单词符号表及ID和NUM的正规定义式,构造出状态转换图;2.定义相关的变量和数据结构。
关键字作为特殊标识符处理,把它们预先安排在一张表格中(称为关键字表),当扫描程序识别出标识符时,查关键字表。
如能查到匹配的单词,则该单词为关键字,否则为一般标识符。
关键字表为一个字符串数组,其描述如下:char KEY_WORDS[7]={″main″,″int″,″char″,″if″,″else″,″for″,″while″};用以存放单词符号二元式的数据结构可如下定义:class Word_Analyzer{public:char Content[MAXLENGTH] ;int val ;void print();} ;5.按照编译程序一遍扫描的要求,把词法分析器Scaner作为一个独立的子程序来设计,通过对Scaner的反复调用识别出所有的单词符号;6.当Scaner识别出一个单词符号时,则将该单词符号的二元式写入到输出文件中。
若Scaner 无法识别出一个单词符号时,则调用错误处理程序PrintError,显示当前扫描到的字符及其所在行、列位置,并跳过该字符重新开始识别单词符号。
四、程序测试测试该设计词法分析器,可对下面的源程序进行词法分析:main(){int i = 10;while(i) i = i - 1;}输出如下二元式代码序列:(1,main) (26,() (27,)) (30,{) (2,int) (10,i) (21,=) (20,10) (34,;) (7,while) (26,() (10,i) (27,)) (10,i) (21, =) (10,i) (23,-) (20,1) (34,;) (31,})五、结论该词法分析器功能良好,可以完成预定的要求。
六、程序代码#include <iostream> #include <vector>#include <string>#include <fstream> using namespace std;/*用来存储目标文件名*/ string file_name;/*提取文本文件中的信息。
*/ string GetText();/*获得一个单词符号,从位置i开始查找。
//并且有一个引用参数j,用来返回这个单词最后一个字符在str的位置。
*/string GetWord(string str,int i,int& j);/*这个函数用来除去字符串中连续的空格和换行//第一个参数为目标字符串,第二个参数为开始位置//返回值为连续的空格和换行后的第一个有效字符在字符串的位置*/int DeleteNull(string str,int i);/*判断i当前所指的字符是否为一个分界符,是的话返回真,反之假*/bool IsBoundary(string str,int i);/*判断i当前所指的字符是否为一个运算符,是的话返回真,反之假*/bool IsOperation(string str,int i);/*此函数将一个pair数组输出到一个文件中*/void OutFile(vector<pair<int,string> > v);/*此函数接受一个字符串数组,对它进行词法分析,返回一个pair型数组*/vector<pair<int,string> > analyst(vector<string> vec);/*此函数判断传递的参数是否为关键字,是的话,返回真,反之返回假*/bool IsKey(string str);int main(){string com1=" ";string com2="\n";string fileline=GetText();int begin=0,end=0;vector<string> array;do{begin=DeleteNull(fileline,begin);string nowString;nowString=GetWord(fileline,begin,end); if(end==-1)break;if(pare(com1)&&nowString.c ompare(com2))array.push_back(nowString); begin=end+1;}while(true);vector<pair<int,string> > mid_result;mid_result=analyst(array);OutFile(mid_result);cout<<"******************************** **************************************\ n";cout<<"***程序已完成词法分析,分析结果已经存储在文件"<<file_name<<"中!!!***\n";cout<<"******************************** **************************************\ n";system("pause");return 0;}/*提取文本文件中的信息*/string GetText(){string file_name1;cout<<"请输入源文件名(包括路径和后缀名):";cin>>file_name1;ifstreaminfile(file_name1.c_str(),ios::in);if (!infile){cerr<<"无法打开文件! "<<file_name1.c_str()<<" !!!"<<endl;exit(-1);}cout<<endl;char f[1000];infile.getline(f,1000,EOF);infile.close();return f;}/*获得一个单词符号,从位置i开始查找。
//并且有一个引用参数j,用来返回这个单词最后一个字符在原字符串的位置。
*/string GetWord(string str,int i,int& j) {string no_use("(){} , ; \n+=*/-<>\"");j=str.find_first_of(no_use,i);if(j==-1)return "";if(i!=j)j--;return str.substr(i,j-i+1);}/*这个函数用来除去字符串中连续的空格和换行//第一个参数为目标字符串,第二个参数为开始位置//返回值为连续的空格和换行后的第一个有效字符在字符串的位置*/int DeleteNull(string str,int i){for(;;i++)if(str[i]!=' '&&str[i]!='\n')return i;}/*判断i当前所指的字符是否为一个分界符,是的话返回真,反之假*/bool IsBoundary(string str,int i){int t;chararr[7]={',',';','{','}','(',')','\"'}; for (t=0;t<7;t++) if(str[i]==arr[t])return true;return false;}/*判断i当前所指的字符是否为一个运算符,是的话返回真,反之假*/bool IsOperation(string str,int i){int t;chararr[7]={'+','-','*','/','=','<','>'};for (t=0;t<7;t++)if(str[i]==arr[t])return true;return false;}/*此函数将一个个字符串数组输出到一个文件中*/void OutFile(vector<pair<int,string> > v){cout<<"请输入目标文件名(包括路径和后缀名):";cin>>file_name;ofstreamoutfile(file_name.c_str(),ios::out);if (!outfile){cerr<<"无法打开文件! "<<file_name.c_str()<<" !!!"<<endl;exit(-1);}cout<<endl;int i;for(i=0;i<v.size();i++)outfile<<"<"<<v[i].first<<" , \""<<v[i].second<<"\">"<<endl;outfile<<"\n\n************************* ********\n";outfile.close();return;}/*此函数接受一个字符串数组,对它进行词法分析,返回一个pair型数组*/vector<pair<int,string> > analyst(vector<string> vec){vector<pair<int,string> > temp;int i;for(i=0;i<vec.size();i++){if(vec[i].size()==1){if((vec[i]==">"||vec[i]=="<"||vec[i]==" !")&&vec[i+1]=="="){string jk=vec[i];jk.append(vec[++i],0,1);pair<int,string> pp(4,jk); temp.push_back(pp);continue;}if((vec[i]=="+"&&vec[i+1]=="+")||(vec[i ]=="-"&&vec[i+1]=="-")){string jk=vec[i];jk.append(vec[++i],0,1);pair<int,string> pp(4,jk); temp.push_back(pp);continue;}if(IsBoundary(vec[i],0)){pair<int,string>pp(5,vec[i]);temp.push_back(pp);}else if(IsOperation(vec[i],0)) {pair<int,string>pp(4,vec[i]);temp.push_back(pp);} elseif(vec[i][0]<='9'&&vec[i][0]>='0'){pair<int,string>pp(3,vec[i]);temp.push_back(pp);}else{pair<int,string>pp(2,vec[i]);temp.push_back(pp);}}elseif(vec[i][0]<='9'&&vec[i][0]>='0'){pair<int,string> pp(3,vec[i]); temp.push_back(pp);}else if(IsKey(vec[i])){pair<int,string> pp(1,vec[i]); temp.push_back(pp);}else{pair<int,string> pp(2,vec[i]); temp.push_back(pp);}}return temp;}/*此函数判断传递的参数是否为关键字,是的话,返回真,反之返回假*/bool IsKey(string str){stringp[16]={"char","double","int","long","do uble","float","for","while","do","break ","continue","switch","short","case","r eturn","if"};vector<string> ppp(p,p+16);int u;for(u=0;u<ppp.size();u++) if(!pare(ppp[u])) return true;return false; }/*finished*/。