?? by31.cpp
字號:
////////////////////////////////////////////////////////////////
//版權所有:臺州學院信息與電子工程學院計算機系 應老師
//制作日期:2003年10月25日
//《編譯原理》試驗示例
//
//程序功能:
//根據算符優先分析法,將表達式進行語法分析,判斷一個表達式是否正確。
//文法:E→E+E|E-E|E*E|E/E|(E)|i
// 其中i為無符號整數
//
//例:
//輸入:10;
//輸出:正確
//輸入:1+2;
//輸出:正確
//輸入:(1+2)/3+4-(5+6/7);
//輸出:正確
//輸入:((1-2)/3+4;
//輸出:錯誤
//
//輸入測試數據保存在同目錄的文本文件testin.txt中,保存格式:
// 表達式行;
// 表達式行;
// .....
//預期的輸出保存在同目錄的文本文件testout.txt中,保存格式:
// 表達式行;
// 正確/錯誤
// 表達式行;
// 正確/錯誤
// .....
/////////////////////////////////////////////////////////////////
#include "stdio.h"
#include "stdlib.h"
#define TRUE 1
#define FALSE 0
//文件信息:
#define TESTIN_FILENAME "testin.txt"
#define TESTOUT_FILENAME "testout.txt"
FILE * fTestIn;
FILE * fTestOut; //打開文件后的柄
//運算符定義:
#define O_NUMBER 8 //運算符個數,+-*/()i#
#define O_PLUS 0 // 加+
#define O_MINUS 1 // 減-
#define O_TIMES 2 // 乘*
#define O_SLASH 3 // 除/
#define O_L_PAREN 4 //左括號(parenthesis)
#define O_R_PAREN 5 //右括號
#define O_IDENT 6 //標識符
#define O_NUL 7 //語法界符#
//表達式緩沖區:由專門函數操作(ReadFormula(),GetChar())
#define BUFFER_SIZE 1000 //表達式緩沖區大小
char Buffer[BUFFER_SIZE]; //表達式緩沖區,以'\0'表示結束
int ipBuffer = 0; //表達式緩沖區當前位置序號
//算符優先關系表:
char O_Table[O_NUMBER][O_NUMBER] = {
{'>','>','<','<','<','>','<','>'},
{'>','>','<','<','<','>','<','>'},
{'>','>','>','>','<','>','<','>'},
{'>','>','>','>','<','>','<','>'},
{'<','<','<','<','<','=','<','-'},
{'>','>','>','>','-','>','-','>'},
{'>','>','>','>','-','>','-','>'},
{'<','<','<','<','<','-','<','='}
}; //優先關系表:八個字符分別是+-*/()i#,其中'-'表示出錯
//文法:
#define OG_NUMBER 6 //文法個數
char OG[OG_NUMBER][4] = {"E+E","E-E","E*E","E/E","(E)","i"}; //文法右部
//單詞序列存放格式定義:
#define TOKEN_MAX_LENTH 100 //最大的單詞長度+1
typedef struct
{
char ch; //存放字符:+-*/()i#E
int No; //存放算符優先關系表中的序號
//double Value; //當ch==i時,且為數值時,存放值的大小
} SToken;
#define MAX_TOKEN_NUMBER 1000 //在一個表達式中允許最大的單詞個數
SToken Token[MAX_TOKEN_NUMBER]; //單詞序列,最后一個以“#”結束
int TokenNumber = 0; //單詞序列中包含的單詞個數
int ipToken = 0; //進行“移進-規約”時的位置指示
//堆棧:由專門的函數操作(PopUp(),Push(),…)
#define STACK_MAX_SIZE 1000 //堆棧最大存儲量
SToken Stack[STACK_MAX_SIZE]; //堆棧
int ipStack = 0; //堆棧指針,指向棧頂(下一個空位置)
//詞法分析專用全局變量:
char ch; //存放取得的一個字符
//char AToken[TOKEN_MAX_LENTH]; //存放組成的單詞,存放時以\0為結束
//int ipAToken; //用于讀字符時,指向下一個AToken[]的位置,便于組成單詞
//錯誤信息:
char * ErrMsg; //出錯信息
//函數聲明:
bool Judge(); //利用算符優先關系表判斷單詞序列是否正確
int GuiYue(); //規約,并判斷是否完成
bool IsOK(); //判斷規約是否全部完成
bool GuiYueN(int n); //將堆棧中0~n單詞規約
int FindPriorOp(int Begin); //在堆棧中,從Begin開始,查找前一個終結符位置
int MoveIn(); //移進,并判斷是否需要規約
void JudgeInit(); //(利用算符優先關系表判斷單詞序列是否正確)判斷前的初始化
SToken Peek(int n); //窺視堆棧
bool PopUp(int n); //彈出堆棧
void PushToken(char ch, int O_No); //壓棧(以字符形式)
void Push(SToken Token); //壓棧
bool Init(); //全局初始化
void End(); //程序退出前作善后處理
void OutPut(char * Formula, char * Result); //將結果輸出到文件
bool ReadFormula(); //從文件中讀出一個表達式存于表達式緩沖區Buffer[]中,以'\0'結束,并置ipBuffer=0;
bool ChangeToTokens(); //將表達式分割成單詞序列
char GetFirstChar(); //從表達式緩沖區中取到下面第一個非空字符
char GetChar(); //從表達式緩沖區取一個字符,返回該字符的同時將它存于全局變量ch中
bool MakeErr(char * ErrMassage); //生成錯誤信息,錯誤信息存于全局變量ErrMsg中
///////////////////////////////////////
void main()
{
if(! Init()) //初始化
{
printf("初始化失敗!程序不能繼續。錯誤信息如下:\n%s\n",ErrMsg);
exit(0);
}
while(ReadFormula()) //從文件中讀表達式成功
{
if(ChangeToTokens()) //將表達式分割成單詞序列
{
if(Judge()) //利用算符優先關系表判斷表達式(單詞序列)是否正確
OutPut(Buffer,"正確!");
else
OutPut(Buffer,ErrMsg); //輸出錯誤信息
}
else //出錯
{
OutPut(Buffer,ErrMsg); //輸出錯誤信息
}
}
End(); //程序退出前作善后處理
}
//利用算符優先關系表判斷單詞序列是否正確
//返回:TRUE正確;FALSE錯誤,且錯誤信息存于ErrMsg
//本函數的實現思路:
// 將單詞序列進行“移進-規約”操作,最后判斷是否能全部完成
// 使用到:堆棧(SToken Stack[])、文法(char OG[][])、算符優先關系表(char O_Table[][])等
bool Judge()
{
JudgeInit();
PushToken('#',O_NUL); //將“#”號置棧底
while(TRUE) //進行“移進-規約”操作
{
switch(MoveIn())
{
case 1: //需要規約
switch(GuiYue())//規約
{
case 1: //這一步規約成功
break;
case 2: //規約全部完成
return TRUE;
default: //出錯
ErrMsg = "規約錯誤。";
return FALSE;
}
break;
case 2: //需要繼續移進
break;
default: //出錯
return FALSE;
}
}
}
//規約,并判斷是否完成
//返回:-1出錯,1這一步規約成功,2規約全部完成
int GuiYue()
{
int n0,n;
char r; //存優先關系
n = FindPriorOp(-1); //取得堆棧中第一個終結符
if(Peek(n).ch == '#') //出錯或全部結束
{
if(IsOK())
return 2;
else
return -1;
}
while(TRUE)
{
n0 = n;
n = FindPriorOp(n0); //前一個終結符的堆棧位置
if(n - n0 > 2) //出錯(多個非終結符相鄰)
return -1;
r = O_Table[Peek(n).No][Peek(n0).No];
if(r == '<') //尋找結束
{
if(! GuiYueN(n - 1)) //規約(從前一個后的字符開始)規約失敗
return -1;
else //規約成功,還要判斷是否全部完成
{
if(IsOK())
return 2; //規約全部完成
else
return 1; //這一步規約成功
}
}
else if(r == '=') //繼續向前找
{
continue;
}
else //出錯(r為>或沒有關系)
return -1;
}
}
//判斷規約是否全部完成
//返回:TRUE全部完成;FALSE沒有完成
bool IsOK()
{
//if(Peek(1) == NULL) return FALSE;
if(Peek(0).ch == 'E'&& Peek(1).ch == '#' && Token[ipToken].ch == '#')
return TRUE;
else
return FALSE;
}
//返回:TRUE成功,FALSE失敗
bool GuiYueN(int n) //將堆棧中0~n單詞規約
{
int i,j;
bool k;
for(i=0;i<OG_NUMBER;i++) //將規約串和文法右部OG[][]每一個進行比較
{
for(j=n,k=FALSE;j>=0;j--)
{
if(OG[i][n-j] != Peek(j).ch)
{
k = TRUE; //TRUE表示規約串和文法右部不符,
break;
}
}
if(k) continue;
//k==FALSE表示規約串判斷完成
if(OG[i][n+1]=='\0') //文法也判斷完成,匹配成功
{
PopUp(n + 1); //彈出規約串
PushToken('E',O_IDENT); //壓入左部“E”
return TRUE;
}
}
return FALSE;
}
//在堆棧中,從Begin開始,查找前一個終結符位置
//如果從開始找,讓 Begin = -1
int FindPriorOp(int Begin)
{
int n;
n = Begin + 1;
while(Peek(n).ch == 'E')
{
n ++;
}
return n;
}
//移進,并判斷是否需要規約
//返回:-1出錯,1需要規約,2可繼續移進
// 1.單詞結束(遇到“#”號),無法移進,需要規約,返回:1
// 2.單詞沒有結束,需判斷是否可以移進
// 2-1.堆棧單詞<=單詞:移進后返回:2
// 2-2.堆棧單詞>單詞:不能移進,需要規約,返回:1
// 2-3.兩單詞沒有優先關系:出錯,返回:-1
int MoveIn()
{
SToken s,t; //分別存堆棧頂單詞和單詞序列的第一個單詞
char r; //存放優先關系
s = Peek(FindPriorOp(-1)); //取得堆棧中第一個終結符位置
t = Token[ipToken];
r = O_Table[s.No][t.No];
if(t.ch == '#') //單詞結束,無法移進,需要規約
return 1;
else //單詞沒有結束,需判斷是否可以移進
{
if(r == '<' || r == '=') //需要移進
{
Push(t);
ipToken ++;
return 2;
}
else if(r == '>') //不能移進,需要規約
return 1;
else //沒有優先關系,出錯
{
MakeErr("移進時出現兩個沒有優先關系的相鄰單詞。");
return -1;
}
}
}
//(利用算符優先關系表判斷單詞序列是否正確)判斷前的初始化
//由于多個表達式需要依次判斷,因此對每個表達式判斷前都需要初始化
void JudgeInit()
{
ipStack = 0; //堆棧初始化(如果有專門的StackClear()函數則更好)
ipToken = 0; //指向首個單詞
}
//窺視堆棧
//參數:n相對棧頂的位置(0開始)
//成功返回:返回單詞
//不成功返回:NULL
SToken Peek(int n)
{
SToken Token;
if(n > 0 || n < ipStack)
Token = Stack[ipStack - n - 1];
else if(n < 0)
Token = Stack[ipStack - 1];
else
Token = Stack[0];
return Token;
}
//彈出堆棧
//參數:n彈出單詞個數(不能全部彈空,即保留#號)
//不成功返回:FALSE
//成功返回:TRUE
bool PopUp(int n)
{
if(ipStack < 2) return FALSE; //只剩0個或1個
if(n > ipStack - 1) n = ipStack - 1;
ipStack -= n;
return TRUE;
}
//壓棧(以字符形式)
//參數:ch是要壓棧的字符(+-*/()i#E 之一),O_No運算符序號
//調用:Push()
void PushToken(char ch, int O_No)
{
SToken Token;
Token.ch = ch;
Token.No = O_No;
Push(Token);
}
//壓棧
//參數:Token是要壓棧的SToken結構體類型的單詞
//缺點:沒有判斷堆棧是否滿
void Push(SToken Token)
{
Stack[ipStack ++] = Token;
}
//全局初始化
//成功:返回TRUE;失敗:返回FALSE
bool Init()
{
//if((fTestIn = fopen(TESTIN_FILENAME, "r")) = NULL) return ! MakeErr("不能打開測試文件!");
//if((fTestOut = fopen(TESTOUT_FILENAME, "w")) = NULL) return ! MakeErr("不能打開結果輸出文件!");
fTestIn = fopen(TESTIN_FILENAME, "r");
fTestOut = fopen(TESTOUT_FILENAME, "w");
return TRUE;
}
//程序退出前作善后處理
//主要是關閉文件等
void End()
{
fclose(fTestIn);
fclose(fTestOut);
}
//將結果輸出到文件
//要求文件事先以追加方式打開,文件指針為fTestOut
//參數:Formula表達式內容,Result判斷結果
void OutPut(char * Formula, char * Result)
{
fprintf(fTestOut,"%s\n%s\n",Formula,Result);
}
//從文件中讀出一個表達式存于表達式緩沖區Buffer[]中,以'\0'結束,并置ipBuffer=0;
//需要先打開文件,文件指針存于fTestIn
//讀出非空表達式:返回 TRUE;文件結束:返回 FALSE
bool ReadFormula()
{
int n = 0;
bool k = FALSE; //當 k==TRUE 時表示文件結束,否則文件沒有結束
while(TRUE)
{
if((Buffer[n] = fgetc(fTestIn)) != EOF) //讀出一個字符成功
{
if(Buffer[n] == ';') break;
n ++;
}
else //文件結束
{
k = TRUE;
break;
}
}
Buffer[n] = '\0'; //最后一個字符用結束標記'\0'代替
ipBuffer = 0; //初始化緩沖區指針
if(n > 0) //讀出的數據非空,返回成功
return TRUE;
else //讀出的數據為空,需要判斷文件結束,還是只有';'的空表達式
{
if(k) //文件結束
return FALSE;
else //空表達式,文件沒有結束,讓它繼續讀下一個表達式
return ReadFormula();
}
}
//將表達式分割成單詞序列
//結果:單詞序列存于SToken Token[]中,單詞個數存于TokenNumber中
//這是一個大模塊,其中要調用一些子函數
//本函數只識別:運算符+-*/、括號()、無符號整數i,并在末尾添加#號
// 遇到其它任何字符都返回錯誤信息
//返回:TRUE表示成功;FALSE表示失敗,同時將錯誤信息存于全局變量ErrMsg中
//使用到的其他全局變量:ch(取一個字符)、AToken[](取到的單詞)
bool ChangeToTokens()
{
TokenNumber = 0;
if(GetFirstChar() == '\0') return ! MakeErr("表達式為空。");
while(TRUE) //對緩沖區進行循環讀
{
if(ch <= 32 && ch > 0) GetFirstChar(); //濾去空格
switch(ch) //對單詞的第一個進行判斷,在下面一次處理整個單詞
{
case '\0':
Token[TokenNumber].ch = '#';
Token[TokenNumber].No = O_NUL;
return TRUE; //處理結束
case '+':
Token[TokenNumber].ch = '+';
Token[TokenNumber].No = O_PLUS;
GetChar();
break;
case '-':
Token[TokenNumber].ch = '-';
Token[TokenNumber].No = O_MINUS;
GetChar();
break;
case '*':
Token[TokenNumber].ch = '*';
Token[TokenNumber].No = O_TIMES;
GetChar();
break;
case '/':
Token[TokenNumber].ch = '/';
Token[TokenNumber].No = O_SLASH;
GetChar();
break;
case '(':
Token[TokenNumber].ch = '(';
Token[TokenNumber].No = O_L_PAREN;
GetChar();
break;
case ')':
Token[TokenNumber].ch = ')';
Token[TokenNumber].No = O_R_PAREN;
GetChar();
break;
default:
if(ch >= '0' && ch <= '9') //整數
{
while(GetChar()>0)
{
if(ch < '0' || ch > '9') break;
}
Token[TokenNumber].ch = 'i';
Token[TokenNumber].No = O_IDENT;
}
else
{
return ! MakeErr("表達式中含有非法字符。");
}
break;
}
TokenNumber ++;
}
}
//從表達式緩沖區中取到下面第一個非空字符
//成功:返回字符;不成功:返回'\0'
char GetFirstChar()
{
while(GetChar() != '\0')
{
if(ch>32) return ch;
}
return '\0';
}
//從表達式緩沖區取一個字符,返回該字符的同時將它存于全局變量ch中
//成功:返回字符;不成功:返回'\0'
char GetChar()
{
if((ch = Buffer[ipBuffer]) != '\0')
ipBuffer ++;
return ch;
}
//生成錯誤信息
//錯誤信息存于全局變量ErrMsg中
//返回:TRUE
bool MakeErr(char * ErrMassage)
{
ErrMsg = ErrMassage;
return TRUE;
}
?? 快捷鍵說明
復制代碼
Ctrl + C
搜索代碼
Ctrl + F
全屏模式
F11
切換主題
Ctrl + Shift + D
顯示快捷鍵
?
增大字號
Ctrl + =
減小字號
Ctrl + -