编译技术实验报告实验题目:词法分析学院:信息学院专业:计算机科学与技术学号:姓名:一、实验目的(1)理解词法分析的功能;(2)理解词法分析的实现方法;二、实验内容PL0的文法如下‘< >’为非终结符。
‘::=’ 该符号的左部由右部定义,可读作“定义为”。
‘|’ 表示‘或’,为左部可由多个右部定义。
‘{ }’ 表示花括号内的语法成分可以重复。
在不加上下界时可重复0到任意次数,有上下界时可重复次数的限制。
‘[ ]’ 表示方括号内的成分为任选项。
‘( )’ 表示圆括号内的成分优先。
上述符号为“元符号”,文法用上述符号作为文法符号时需要用引号‘’括起。
〈程序〉∷=〈分程序〉.〈分程序〉∷= [〈变量说明部分〉][〈过程说明部分〉]〈语句〉〈变量说明部分〉∷=V AR〈标识符〉{,〈标识符〉}:INTEGER;〈无符号整数〉∷=〈数字〉{〈数字〉}〈标识符〉∷=〈字母〉{〈字母〉|〈数字〉}〈过程说明部分〉∷=〈过程首部〉〈分程序〉{;〈过程说明部分〉};〈过程首部〉∷=PROCEDURE〈标识符〉;〈语句〉∷=〈赋值语句〉|〈条件语句〉|〈过程调用语句〉|〈读语句〉|〈写语句〉|〈复合语句〉|〈空〉〈赋值语句〉∷=〈标识符〉∶=〈表达式〉〈复合语句〉∷=BEGIN〈语句〉{;〈语句〉}END〈条件〉∷=〈表达式〉〈关系运算符〉〈表达式〉〈表达式〉∷=〈项〉{〈加法运算符〉〈项〉}〈项〉∷=〈因子〉{〈乘法运算符〉〈因子〉}〈因子〉∷=〈标识符〉|〈无符号整数〉|'('〈表达式〉')'〈加法运算符〉∷=+|-〈乘法运算符〉∷=*〈关系运算符〉∷=<>|=|<|<=|>|>=〈条件语句〉∷=IF〈条件〉THEN〈语句〉〈字母〉∷=a|b|…|X|Y|Z〈数字〉∷=0|1|2|…|8|9实现PL0的词法分析三、实验分析与设计PL0词法分析程序是一个独立的过程,其功能是为语法语义分析提供单词,把输入的字符串形式的源程序分割成一个个单词符号传递给语法语义分析。
其主要方法步骤为从源程序扫描下一个字符,忽略空格、换行、TAB和注释并识别单词,再将不同类别的单词归类输出。
四、实验的实现#include <stdio.h>#include<stdlib.h>#include<string.h>#include<ctype.h>#include<stdbool.h>#define norw 11 //norw-1个关键字#define al 20 //最长的关键字的长度#define ID norw#define INT norw+1#define COMMA norw+2#define ENDF norw+3#define COLON norw+4#define SEMIC norw+5#define ADD norw+6#define MINUS norw+7#define MULTI norw+8#define EV ALU norw+9#define LE norw+10#define NE norw+11#define LT norw+12#define EQ norw+13#define GE norw+14#define GT norw+15#define FLOAT norw+16char TOKEN[20]; //字符数组用来依次存放单词词文的各个字符extern int lookup(char *); //以TOKEN字符串查保留字表extern void report_error(char); //报告程序中的词法错误bool isalpha(char); //判断接收字符是否为字母bool isalnum(char); //判断接收字符是否为字母或者数字bool isdigit(char); //判断接收字符是否为数字bool isannotation(char); //判断接收字符是否为注释extern char letter(char c); //用来将大写字母转化成小写字母FILE* fin;FILE* fout;void scanner(){//词法分析的主体程序,对输入的文本文件进行词法分析char ch;int i,c;int error=0; //记录文件中词法错误的个数ch=fgetc(fin); //从输入文件中读取一个字符while(ch!=EOF){//当从输入文件接收的字符不是文件结束符时,执行循环if(isalpha(ch)){//如果从输入文件接收的第一个字符是字母ch=letter(ch);TOKEN[0]=ch;ch=fgetc(fin);i=1;while(isalnum(ch)){ ch=letter(ch);TOKEN[i]=ch;i++;ch=fgetc(fin);}TOKEN[i]='\0';c=lookup(TOKEN); //查保留字表if(c==0) {fprintf(fout,"(%d,%s)\n", ID,TOKEN);} //输出标识符else fprintf(fout,"(%d,%s)\n", c,TOKEN); //输出接收单词为保留字}if(isdigit(ch)) //如果从输入文件接收的第一个字符是数字{int cdot=0; //统计小数点个数TOKEN[0]=ch;ch=fgetc(fin);i=1;while(isdigit(ch)||ch=='.'){//从第二个接收字符开始,当是数字或者是小数点时,执行循环if(ch=='.')cdot++;TOKEN[i]=ch;i++;ch=fgetc(fin);//重复接收字符,直到接收到非数字if(cdot>=2){error++;TOKEN[i]='\0';printf("%s is error\n", TOKEN);break;}}if(isalpha(ch)) //如果第二个字符是字母{while(isalpha(ch)) //接收完所有的字母,跳出循环{TOKEN[i]=ch;i++;ch=fgetc(fin);}TOKEN[i]='\0';error++;printf("%s is error\n", TOKEN);}else if(cdot==0) //当接收的字符为整型单词时{fseek(fin,-1,1);TOKEN[i]='\0';int a,temp=0,c;for(c=0;c<i;c++){a=TOKEN[c] - '0';if(c!=0){temp=temp*10;temp=temp+a;}else{temp=a;}}fprintf(fout,"(%d,%d)\n", INT, temp); //输出接收单词为整数}else if(cdot==1){fseek(fin,-1,1);TOKEN[i]='\0';int a,part1=0,jc,b=0; //b用来确定小数点所在的位置float c=0.1,part2=0.0;while(TOKEN[b]!='.'){b=b+1;}for(jc=0;jc<b;jc++){a=TOKEN[jc] - '0';if(jc!=0){part1=part1*10;part1=part1+a;}else{part1=a;}}for(jc=b+1;jc<i;jc++){a=TOKEN[jc]-'0';part2=a*c+part2;c=c*0.1;}fprintf(fout,"(%d,%f)\n", FLOAT, part1+part2);//输出接收单词为小数}else if(cdot==2){fseek(fin,-1,1);}}else //如果从输入文件接收的第一个字符既不是字母又不是数字switch(ch){//将所接收到的符号字符进行分类,采取一符一类case':':ch=fgetc(fin);if(ch=='=') fprintf(fout,"(%d,:=)\n", EV ALU); //输出接收符号为赋值号else{ch=fgetc(fin);fseek(fin,-1,1); //文件接收字符回推一个字符fprintf(fout,"(%d,':')\n", COLON); //输出冒号}break;case',':fprintf(fout,"(%d,',')\n", COMMA); break;//输出逗号case'.':fprintf(fout,"(%d,'.')\n", ENDF);break; //输出句号case';':fprintf(fout,"(%d,'.')\n", SEMIC);break; //输出分号case'+':fprintf(fout,"(%d,'+')\n", ADD);break; //输出加号case'-':fprintf(fout,"(%d,'-')\n", MINUS);break; //输出减号case'*':fprintf(fout,"(%d,'*')\n", MULTI);break; //输出乘号case'<':ch=fgetc(fin);if(ch=='=')fprintf(fout,"(%d,'<=')\n", LE); //输出小于或等于号else if(ch=='>')fprintf(fout,"(%d,'<>')\n", NE); //输出不等于号else{fseek(fin,-1,1);fprintf(fout,"(%d,'<')\n", LT);; //输出小于号}break;case'=':fprintf(fout,"(%d,'=')\n", EQ);break; //输出等于号case'>':ch=fgetc(fin);if(ch=='=')fprintf(fout,"(%d,'>=')\n", GE); //输出大于或等于号else{fseek(fin,-1,1);fprintf(fout,"(%d,'>')\n", GT); //输出大于号}break;case' ':break;case'\n':break;case'\t':break;case'/':ch=fgetc(fin);//检查是否为单行注释if(ch=='/'){while(ch!='\n'){ch=fgetc(fin);}}else {fseek(fin,-1,1);printf("/ is error\n");error++;}break;case'{':while(1){ch=fgetc(fin);if(ch=='}') break;if(ch==EOF) {fseek(fin,-1,1);printf("{ is error\n");error++;break;}}break;default:printf("%c is error\n", ch); //接收非上述字符程序报告词法错误error++;break;}ch=fgetc(fin); //继续从文件中读取下一个单词,直到文件结束}//while循环结束printf("共发现%d 个词法错误!",error);return;}int lookup(char *token){int j;char word[norw][al];strcpy(&(word[1][0]), "begin" );strcpy(&(word[2][0]), "end");strcpy(&(word[3][0]), "var");strcpy(&(word[4][0]), "integer");strcpy(&(word[5][0]), "while");strcpy(&(word[6][0]), "do");strcpy(&(word[7][0]), "if");strcpy(&(word[8][0]), "then");strcpy(&(word[9][0]), "procedure");strcpy(&(word[10][0]), "else");for(j=1;j<=norw-1;j++)if(strcmp(token,word[j])==0) return j; //以TOKEN字符串查保留字表,若查到返回保留字类别码return 0; //TOKEN不是保留字,返回0}bool isalpha(char c){ //判断接收字符是否为字母if((c>='a'&&c<='z')||(c>='A'&&c<='Z'))return 1;else return 0;}bool isalnum(char c){//判断接收字符是否为字母或者数字if((c>='a'&&c<='z')||(c>='A'&&c<='Z')||(c>='0'&&c<='9'))return 1;else return 0;}bool isdigit(char c){//判断接收字符是否为数字if(c>='0'&&c<='9')return 1;else return 0;}char letter(char c) //将大写字母转换成小写字母,即不区分大小写{if(c>='A'&&c<='Z'){c=c+32;}return c;}int main(){char filename[20];printf("请输入文件名:");scanf("%s",filename);if((fin=fopen(filename,"r"))==NULL) //打开要读取的文本文件{printf("不能打开文件.\n");exit(0);}printf("请输入保存分析结果的文件名:");scanf("%s",filename);if((fout=fopen(filename,"w"))==NULL){printf("不能打开文件.\n");exit(0);}scanner(); //调用词法分析程序//getchar();getchar();fclose(fin);fclose(fout);return 0;}五、运行的结果。