当前位置:
文档之家› 编译原理实验报告2词法分析程序的设计
编译原理实验报告2词法分析程序的设计
八进制整数0(1|2|3|4|5|6|7)(0|1|2|3|4|5|6|7)*
十六进制整数0x(0|1|2|3|4|5|6|7|8|9|a|b|c|d|e|f)(0|1|2|3|4|5|6|7|8|9|a|b|c|d|e|f)*
运算符和界符+ - * / > < = ( );
关键字if then else while do
SearchOp():整型函数,对ch查找运算符和界符,若它是一个运算符或界符,则返回它的编码,否则返回0。
Retract():子函数,将搜索指示器回调一个字符位置,将ch置为空白字符。
ProError():错误处理函数。
关键字保存在字符数组中,定义编码为相对数组首地址的位置+ 1。保留子表顺序如下:{if,then,else,while,do} ,则相应编码为:1,2,3,4,5。
2、根据状态图,设计词法分析函数int scan( ),完成以下功能:
1)从文本文件中读入测试源代码,根据状态转换图,分析出一个单词,
2)以二元式形式输出单词<单词种类,单词属性>
其中单词种类用整数表示:
0:标识符
1:十进制整数
2:八进制整数
3:十六进制整数
运算符和界符,关键字采用一字一符,不编码
其中单词属性表示如下:
}while(ch ==' '|| ch =='\t'|| ch =='\n');
returnch;
}
voidConcat(charch,charstrToken[]) {//将ch中的字符连接到strToken之后
charstr[2];
str[0] =ch;
str[1] ='\0';
strcat(strToken,str);
intflag = 0;
if(ch>='0'&&ch<='9')
GetBC():子函数,检查ch中的字符是否为空白。若是,则调用GetChar()直至ch中进入一个非空白字符。
Concat():子函数,将ch中的字符连接到strToken之后。
IsLetter():布尔函数,判断ch中的字符是否为字母。
IsDigit():布尔函数,判断ch中的字符是否为数字。
Reserve():整型函数,对strToken中的字符串查找保留字表,若它是一个保留字则返回它的编码,否则返回0。
3、采用C或C++语言,设计函数scan( ),实现该算法;
charGetChar(FILE*fp) {//读取文件中的一个字符
charch;
ch = fgetc(fp);
returnch;
}
charGetBC(FILE*fp) {//读取文件的字符直至ch不是空白
charch;
do{
ch = GetChar(fp);
while(ch >=‘0’&& ch <=‘7’)
{ Concat();GetChar(); }
Retract();
printf("<,2,%s >", strToken) ;
}
else if(ch==’x’) {
GetChar();
while(IsDigit() || ch>=‘a’&& ch<=’f’)
2、根据状态图,设计词法分析算法;
观察状态图,其中状态2、4、7、10(右上角打了星号)需要回调一个字符。
声明一些变量和函数:
ch:字符变量,存放最新读进的源程序字符。
strToken:字符串变量,存放构成单词符号的字符串。
GetChar():子函数,将下一输入字符读到ch中,搜索指示器前移一字符位置。
实验2词法分析程序的设计
一、实验目的
掌握计算机语言的词法分析程序的开发方法。
二、实验内容
编制一个能够分析三种整数、标识符、主要运算符和主要关键字的词法分析程序。
三、实验要求
1、根据以下的正规式,编制正规文法,画出状态图;
标识符<字母>(<字母>|<数字字符>)*
十进制整数0 |((1|2|3|4|5|6|7|8|9)(0|1|2|3|4|5|6|7|8|9)*)
GetBC();
if(IsLetter()) {
while(IsLetter() || IsDigit())
{ Concat();GetChar(); }
Retract();
If(Reserve())printf("<%s , ->", strToken);
elseprintf("<,0,%s >", strToken);
标识符,整数由于采用一类一符,属性用单词表示
运算符和界符,关键字采用一字一符,属性为空
3、编写测试程序,反复调用函数scan( ),输出单词种别和属性。
四、实验环境
PC微机
DOS操作系统或Windows操作系统
Turbo C程序集成环境或Visual C++程序集成环境
五、实验步骤
1、根据正规式,画出状态转换图;
{ Concat();GetChar(); }
Retract();
printf("<,3,%s >", strToken);
}
else {
Retract();
printf(“<1,0>“) ;
}
}
else if(SearchOp()) printf("<%c,->",ch);
else ProError();
}
else if(‘1’< =ch && ch <=’9’) {
while(IsDigit())
{ Concat();GetChar(); }
Retract();
printf("<,1,%s >", strToken) ;
}
else if(ch==’0’) {
GetChar();
if(ch >=‘1’&& ch <=‘7’) {
}
intIsLetter(charch) {//布尔函数,判断ch中的字符是否为字母,是返回1,否则返回0
intflag = 0;
if(ch>='a'&&ch<='z')
flag = 1;
returnflag;
}
intIsDigit(charch) {//布尔函数,判断ch中的字符是否为数字,是返回1,否则返回0
运算符和界符保存在字符数组中,编码定义与关键字相同,顺序如下:{+,-,*,/,>,<,=,(,),;},编码为:1~10。
二元表
单词
单词种类
属性
标识符
0
单词自身
十进制整数
1
单词自身
八进制整数
2
单词自身
十六进制整数
3
单词自身
运算符和界符
单词自身
-
关键字
单词自身
-
算法如下:
ch=’‘;strToken=””;