编译原理复习提纲整理

说明

1.这份资料的最初来源是王金伟老师给大家发的复习提纲，我在下面会给大家附一份原版，后面的21面资料是在那个的基础上整理和细化得到的。最初做这份资料的目的是我本人作为班长为了帮助我们班的同学顺利通过考试而整理的。听王老师说有想法留给学弟学妹们用，我放假后又对一些内容进行了修正和改进，得到了大家看到的这个版本

2.这份资料加入了很多我个人的理解。与原提纲相比，我增删了一些内容，并对某些内容进行了调序与合并。

3.这份资料融入了老师平时上课的以及最后复习课给的，更重要的是我个人的理解和猜测。大家或许都有感受，觉得编译原理书上或者上说的句子根本看不懂。针对这个问题，我把很多晦涩难懂的形式化的算法通过我的理解后用比较形象易懂的话表述了

出来，表述得可能并不科学严谨，但我的目的是为了能帮助大家做题和考试

4.里面的每一个考点我都在最后用括号加了注释，方便不同起点不同准备时间的同学进行选择，这里简单说明

“了解”：代表这一部分的内容被老师列在提纲内，但其实并不太影响大家对大题的计算；并且据我的分析也并不太可能出小题所以时间很紧的同学可以略看就好，当然看看还是有好处的。

“小题”一类的字样代表这一块的知识点值得出填空选择，大家

1 / 47

有时间应该理解性的记忆下来（在2012年的期末考试上，选择

为1分*10题；填空为1分*10题，判断改错为2分*5题，小题总计30分）

“简答”：老师在最后复习课上说过编译原理是有简答题的，简

答不同于计算，很可能是让你默写一些步骤。所以这一块内容大家需要背诵，即使不理解也要背下来（在2012年的期末考试上，简答题的分值为5分*4题=20分

“铺垫”“大题步骤”等代表这一块的内容对于综合大题的做题

是必须了解的，或者其实就是做大题的分解步骤，这些块的内容是所有人必须看懂并且记下来的

“实际大题”：总共列出的有4道，应该每年考察的都会是这4

中题型，每一道的分值都在12~15分左右，是所有人想通过考试所必须攻克的。这里通常我会标出他需要用到之前的哪些哪些知识点（2012年期末考试4道题的总分值为50分）

5.如果大家想去打印，最好在装有2007及以上的机器上打印，否则有些符号可能会显示不出来。建议大家去生活广场找机器打，不要去景元鸿

6.由于时间仓促，这份资料做的并不完善和严谨，难免有错漏之处，希望大家谅解。大家可以一边看我的这份资料，一边看老师

最后给的两套，课本来不及就别看了。真心希望这份资料能对大家有用，祝大家都考得好。

2 / 47

最后说一句，我们去年编译原理考得好的人挺多的，其实也不是很难，没有人挂！本人惭愧，只有89，考得比我好的多太多了。总结原因是把时间花在了研究大题上面，小题的很多知识点都没有背熟，随便错了几个小题就基本和90无缘了。

10计1 王成正

2012/7/9

（老师给的提纲原版）

概述一、1. 编译方式与解释方式区别：是否生成目标代码

2. 编译程序总框架

词法分析二、

状态转换图的功能：识别（接受）一定的符号串（单词） 1.状态转换图的程序实现的思路：为每个状态结点都编写一 2.个子程序

字母表的概念：一般用∑表示 3.闭包的概念：闭包V*中的每个字都是由V中的字经过若干 4.3 / 47

次连接而成的

上所有符号串的集合正则闭包的概念：是V 5.定义：表示∑上所有字的全体，空字ε也包括在其中∑* 6.ε∑+空字ε不包含，非7.之间的区别ε，{ }，{}ε 8.

}ε所对应的正规集为{ε 9.

正规式与正规集的定义：知道如何用正规式表示一个正规10.集简述和的定义与区别 11.

的某些结点既是初态结点又是终态结点，或者存在一若M12.εε通路，那么空字条从某初态结点到某个终态结点的所识别可为M 正规式与优先自动机的等价性13.， MV2.对于∑上的每一个正规式，存在一个∑上的定理14.L(M)(V)使得

的化简的概念和方法：终态和非终态是可区别的，因 M15.ε为终态可以读出空字ε，而非终态不能读出空字

课后作业一个例题 16.

yy}上所有倒数第二个字符为，构造一个，它接受∑={x17.的字符串

语法分析三、

（1）基本定义

4 / 47

上下文无关文法的定义 1.句型、句子的概念 2.文法和语言的对应关系，给出文法构造语言，文法G产生 3.的句子的全体是该文法的语言

语法分析树与二义性：判断文法的二义性方法：如果一个 4.文法含有二义性的句子（对应两棵不同的语法树），则称该文法是二义性文法

3型文法是正规文法、正则文法、线性文法 5.2型文法也称为称为上下文无关文法 6.若一个文法是递归的，则由它产生的语言的句子个数是无7.限的

（2）自上而下

8. 文法左递归的定义

9. 消除文法的左递归的方法：直接左递归

10. 消除回溯的方法：提取公共左因子

11. 递归下降分析法的概念，应满足什么条件？

12. 递归下降法对文法的每个非终结符构造一个相应的子程序

13. 预测分析法：给文法构造预测分析表：消除左递归、消除回溯、集、集。举例子时，便成S→（T）

（3）自下而上

14. 短语、直接短语的概念

5 / 47

15. 句柄的概念（一个句型的最左直接短语）

16. 规范归约（最左）、规范推导（最右）、规范句型

17. 规范归约的关键问题是寻找句柄

18. 在规范归约中，可归约串必出现在栈顶

19. 算符文法、算符优先文法的概念，如何判断

20. 构造算符优先关系表、、集合，可不考虑#号

21. 素短语：算符优先归约的关键问题是寻找最左素短语

22. 算符优先法尤其适用于表达式的分析

23. 给出文法G（P）

X →

Y →

Z →

24. 该文法是否为算符优先文法？请根据、集合构造算符优先关系表说明之（12分）

25. 优先函数的优点：便于比较，节省空间

26. 优先函数的构造方法

27. 欲构造行之有效的自上而下分析器，则必须消除文法中含有的左递归

28. 分析法属于自底向上分析方法

29. 从文法出发构造（0）分析表的步骤

四、语义分析

1. 综合属性和继承属性概念

6 / 47

五、中间代码生成

1. 中间代码是一种面向语法，易于翻译成目标代码的代码

2. 后缀式（逆波兰式）的概念

3. 逆波兰式中各运算法出现的顺序与实际运算顺序一致

4. 后缀式与抽象语法树（表达式树）的关系

5. 的含义

6. 四元式表示方法，联系时通过临时变量，可以翻译各种语句

7. 将赋值语句表示成后缀式和四元式

六、代码优化

1. 简述代码优化的原则与优化的级别，并列举三种常用的优化技术

2. 基本块、流图的概念，如何画、节点对应基本块

3. 局部优化的方法，是对基本块进行优化的有效工具

4. P285中间注意

5. 不变运算的代码外提的条件

6. 循环优化中的强度削弱的含义

七、目标代码生成

1. 编译程序生成的目标程序种类

编译原理期末复习

编译原理期末复习鉴于编译原理马上就要期末考试，我将手中集中的一些资料上的题目进行了整理归类，每种类型题目给出了所涉及到的基本知识，然后对每类题目中的第一道例题进行了做法进行了讲解，剩下的例题请给大家作为练习，答案也都给出，希望对大家复习有所帮助，最后由于时间很紧，整理的有些仓促，整理中难免有遗漏或错误，请大家见谅。注：下面出现的字母中，若无特别说明，小写英文字母为终结符，大写英文字母为非终结符，希腊字母为终结符与非终结符的任意组合。 1、简答题（或者名词解释）下面涉及到的概念中，加下划线的都是在以往一些试卷中出现的原题，务必掌握。注：这类题目老师说答案不会超过一百个字，否则写的再多也不给分，有些点到即可，不要重复啰嗦。（1）简述编译程序的概念及其构成答：1）编译程序：它特指把某种高级程序设计语言翻译成等价的低级程序设计语言的翻译程序。 2)构成：（2）简述词法分析阶段的主要任务（也有可能问语法分析阶段主要任务）答：词法分析的任务是输入源程序，对源程序进行扫描，识别其中的单词符号，把字符串形式的源程序转换成单词符号形式的源程序。语法分析的主要任务是对输入的单词符号进行语法分析（根据语法规则进行推导或者归约），识别各类语法单位，判断输入是不是语法上正确的程序 (3) 简述编译程序的构造过程（这个大家看看，是对（1）和（2）的综合）答：1）构造词法分析器：用于输入源程序进行词法分析，输出单词符号； 2）构造语法分析器：对输入的单词符号进行语法分析，识别各类语法单位，判断输入是不是语法上正确的程序 3）构造语义分析和中间代码产生器：按照语义规则对已归约出的语法单位进行语义分析并把它们翻译成中间代码。 4）构造优化器：对中间代码进行优化。 5) 构造目标代码生成器：把中间的代码翻译成目标程序。 6) 构造表格管理程序：登记源程序的各类信息和编译各阶段的进展情况。 7)构造错误处理程序：对出错进行处理。 (4) 说明编译和解释的区别： 1)编译要程序产生目标程序，解释程序是边解释边执行，不产生目标程序； 2)编译程序运行效率高而解释程序便于人机对话。（5）文法：描述语言语法结构的形式规则，一般用一个四元式表示： G=(V T，V N，S，P)，其中V T：终结符集合(非空) V N：非终结符集合(非空)，且V T ?V N=? S：文法的开始符号，S?V N P：产生式集合(有限)。

编译原理习题及答案(整理后)

第一章 1、将编译程序分成若干个“遍”就是为了。 a．提高程序得执行效率 b．使程序得结构更加清晰 c．利用有限得机器内存并提高机器得执行效率 d．利用有限得机器内存但降低了机器得执行效率 2、构造编译程序应掌握。 a．源程序b．目标语言 c．编译方法d．以上三项都就是 3、变量应当。 a．持有左值b．持有右值 c．既持有左值又持有右值d．既不持有左值也不持有右值 4、编译程序绝大多数时间花在上。 a．出错处理b．词法分析 c．目标代码生成d．管理表格 5、不可能就是目标代码。 a．汇编指令代码b．可重定位指令代码 c．绝对指令代码d．中间代码 6、使用可以定义一个程序得意义。 a．语义规则b．语法规则 c．产生规则d．词法规则 7、词法分析器得输入就是。 a．单词符号串b．源程序 c．语法单位d．目标程序 8、中间代码生成时所遵循得就是- 。 a．语法规则b．词法规则 c．语义规则d．等价变换规则 9、编译程序就是对。 a．汇编程序得翻译b．高级语言程序得解释执行 c．机器语言得执行d．高级语言得翻译 10、语法分析应遵循。 a．语义规则b．语法规则 c．构词规则d．等价变换规则二、多项选择题 1、编译程序各阶段得工作都涉及到。 a．语法分析b．表格管理c．出错处理 d．语义分析e．词法分析 2、编译程序工作时，通常有阶段。 a．词法分析b．语法分析c．中间代码生成 d．语义检查e．目标代码生成三、填空题 1、解释程序与编译程序得区别在于。 2、编译过程通常可分为5个阶段，分别就是、语法分析、代码优化与目标代码生成。 3、编译程序工作过程中，第一段输入就是，最后阶段得输出为程序。

四川大学编译原理期末复习总结

一、简答题 1.什么是编译程序答：编译程序是一种将高级语言程序(源程序)翻译成低级语言(目标程序)的程序。将高级程序设计语言程序翻译成逻辑上等价的低级语言(汇编语言,机器语言)程序的翻译程序。 2.请写出文法的形式定义答：一个文法G抽象地表示为四元组 G=（Vn,Vt,P,S） –其中Vn表示非终结符号 –Vt表示终结符号，Vn∪Vt=Ｖ(字母表)，Vn∩Vt=φ –S是开始符号， –P是产生式，形如：α→β(α∈V+且至少含有一个非终结符号，β∈V*) 3.语法分析阶段的功能是什么答：在词法分析的基础上，根据语言的语法规则，将单词符号串分解成各类语法短语(例：程序、语句、表达式)。确定整个输入串是否构成语法上正确的程序。 4.局部优化有哪些常用的技术答：优化技术1—删除公共子表达式优化技术2—复写传播优化技术3—删除无用代码优化技术4—对程序进行代数恒等变换（降低运算强度）优化技术5—代码外提优化技术6—强度削弱优化技术7—删除归纳变量优化技术简介——对程序进行代数恒等变换（代数简化）优化技术简介——对程序进行代数恒等变换（合并已知量） 5．编译过程分哪几个阶段答：逻辑上分五个阶段：词法分析、语法分析、语义分析与中间代码生成、代码优化、目标代码生成。每个阶段把源程序从一种表示变换成另一种表示。 6. 什么是文法答：文法是描述语言的语法结构的形式规则。是一种工具，它可用于严格定义句子的结构；用有穷的规则刻划无穷的集合；文法是被用来精确而无歧义地描述语言的句子的构成方式；文法描述语言的时候不考虑语言的含义。 7. 语义分析阶段的功能是什么答：对语法分析所识别出的各类语法范畴分析其含义，进行初步的翻译(翻译成中间代码)；并对静态语义进行审查。 8.代码优化须遵循哪些原则答：等价原则：不改变运行结果有效原则：优化后时间更短，占用空间更少合算原则：应用较低的代价取得较好的优化效果 9.词法分析阶段的功能是什么答：

编译原理概念_名词解释

编译过程的六个阶段：词法分析，语法分析，语义分析，中间代码生成，代码优化，目标代码生成解释程序：把某种语言的源程序转换成等价的另一种语言程序——目标语言程序，然后再执行目标程序。解释方式是接受某高级语言的一个语句输入，进行解释并控制计算机执行，马上得到这句的执行结果，然后再接受下一句。编译程序：就是指这样一种程序，通过它能够将用高级语言编写的源程序转换成与之在逻辑上等价的低级语言形式的目标程序(机器语言程序或汇编语言程序)。解释程序和编译程序的根本区别：是否生成目标代码句子的二义性（这里的二义性是指语法结构上的。）:文法G[S]的一个句子如果能找到两种不同的最左推导(或最右推导)，或者存在两棵不同的语法树，则称这个句子是二义性的。文法的二义性:一个文法如果包含二义性的句子，则这个文法是二义文法，否则是无二义文法。 LL(1)的含义：(LL(1)文法是无二义的； LL(1)文法不含左递归) 第1个L：从左到右扫描输入串第2个L：生成的是最左推导 1：向右看1个输入符号便可决定选择哪个产生式某些非LL(1)文法到LL(1)文法的等价变换: 1. 提取公因子 2. 消除左递归文法符号的属性:单词的含义，即与文法符号相关的一些信息。如，类型、值、存储地址等。一个属性文法(attribute grammar)是一个三元组A=(G, V, F) G：上下文无关文法。 V：属性的有穷集。每个属性与文法的一个终结符或非终结符相连。属性与变量一样，可以进行计算和传递。 F：关于属性的断言或谓词(一组属性的计算规则)的有穷集。断言或语义规则与一个产生式相联，只引用该产生式左端或右端的终结符或非终结符相联的属性。综合属性:若产生式左部的单非终结符A的属性值由右部各非终结符的属性值决定,则A的属性称为综合属继承属性:若产生式右部符号B的属性值是根据左部非终结符的属性值或者右部其它符号的属性值决定的,则B的属性为继承属性。 (1)非终结符既可有综合属性也可有继承属性，但文法开始符号没有继承属性。 (2) 终结符只有综合属性，没有继承属性，它们由词法程序提供。在计算时：综合属性沿属性语法树向上传递；继承属性沿属性语法树向下传递。语法制导翻译：是指在语法分析过程中，完成附加在所使用的产生式上的语义规则描述的动作。语法制导翻译实现：对单词符号串进行语法分析，构造语法分析树，然后根据需要构造属性依赖图，遍历语法树并在语法树的各结点处按语义规则进行计算。中间代码（中间语言） 1、是复杂性介于源程序语言和机器语言的一种表示形式。 2、一般，快速编译程序直接生成目标代码。 3、为了使编译程序结构在逻辑上更为简单明确，常采用中间代码，这样可以将与机器相关的某些实现细节置于代码生成阶段仔细处理，并且可以在中间代码一级进行优化工作，使得代码优化比较容易实现。何谓中间代码：源程序的一种内部表示，不依赖目标机的结构，易于代码的机械生成。为何要转换成中间代码:(1)逻辑结构清楚；利于不同目标机上实现同一种语言。 (2)便于移植，便于修改，便于进行与机器无关的优化。中间代码的几种形式：逆波兰记号，三元式和树形表示，四元式符号表的一般形式：一张符号表的的组成包括两项，即名字栏和信息栏。信息栏包含许多子栏和标志位，用来记录相应名字和种种不同属性，名字栏也称主栏。主栏的内容称为关键字（key word）。符号表的功能：（1）收集符号属性(2) 上下文语义的合法性检查的依据：检查标识符属性在上下文中的一致性和合法性。(3)作为目标代码生成阶段地址分配的依据

编译原理知识点

1.解释程序：不生成目标代码编译程序：生成目标代码 2.编译程序组成：8个分析< 前端>：(词法分析程序、语法分析程序、语义分析程序、中间代码生成程序) 综合< 后端>：（代码优化程序、目标代码生成程序）贯穿始末：表格管理程序、出错处理程序 3.文法四元组：终结符号集合Vt 、非终结符号集合Vn、产生式集合P、识别符号(开始符号)S V T∩V N＝Φ 文法-> 语言（推导、规约）唯一；语言-> 文法（凑规则）不唯一。 4.文法分类： 0型文法(短语结构文法)：左侧至少含有一个非终结符 1型文法(上下文有关文法)：左侧长度<= 右侧长度S->ε除外，S不能出现在右侧2型文法(上下文无关文法)：左侧只能有一个非终结符( 语法分析) 3型文法(正规文法)：A-> aB A->a 右线性；( 词法分析) A->Ba 或A->a 左线性（看非终结符位置） 5.A*＝A0 ∪A+ A0 ＝{ε} !={ } ＝Φ空集 A+ ＝AA* ＝A*A 6.句型：符号串x是从识别符号S推导出来的，x称为一个句型句子：x仅由终结符号组成，仅含终结符号的句型是一个句子短语：子树的末端（叶子）从左至右连成的串（包括整棵语法树）简单子树：只含有单层分枝的子树直接短语( 简单短语)：由简单子树的叶子组成句柄：最左边的直接短语（不一定含终结符）素短语：至少含有一个终结符的短语，并且除它自身之外不再含任何更小的素短语最左素短语：最左边的素短语短语：P（相对于T、E）、P+T（相对于E）、i（相对于P、F）、P+T+i（相对于E）直接短语：P、i 句柄：P (最左边的直接短语) 素短语：P+T 、i （至少含有一个终结符的短语）最左素短语：P+T 7.二义性文法：有两个不同的最左推导或有两个不同的最右推导或能产生两棵语法树 8.文法产生式正规式规则1 A→xB B→y A = xy

《编译原理》练习题

《编译原理》练习题一一、填空题（每空1分） 1．设G ［S ］是一个文法，我们把能由文法的（1）推导出来的符号串α称为G 的一个句型。当句型α仅由（2）组成时 (即α∈V T * )，则将它称为G 产生的句子。 2．从某一给定的状态q 出发，仅经过若干条 (3) 的矢线所能达到的状态所组成的集合称为ε-CLOSURE(q)。 3．设G=(V N ,V T ,P,S)是一文法，我们说G 中的一个符号X ∈V N ∪V T 是有用的，是指X 至少出现在（4）的推导过程中，否则，就说X 是无用的。我们将不含形如A→A 的产生式和不含无用符号及无用产生式的文法称为（5）。 4．我们常采用形如 (class, value)的二元式作为一个单词的 (6) 。其中,class 是一个整数，用来指示该单词的 (7) ，value 则是单词之值。 5．一个文法G[S]可表示成形如（8）的四元式。其中V N ,V T ,P 均为非空的有限集，分别称为非终结符号集、终结符号集和产生式集， S ∈V N 为文法的开始符号。此外，将出现在各产生式左部和右部的一切符号所组成的集合称为（9），记作V 。显然，V=V N ∪V T ,V N ∩V T =?。 6．通常，可通过两种途径来构造词法分析程序。其一是根据对语言中各类单词的某种描述或定义，用 (10) 构造词法分析程序；另外一种途径是所谓词法分析程序的 (11) 。 7．设G 为一文法，A→α是G 的一个产生式，如果α具有υA δ的形式，其中υ，δ不同时为ε，则称产生式A→α是（12）。若存在推导δυαA A * ??，则称产生式A→α是（13）。 8．设M=(K,Σ,f,S 0,Z)为一DFA ，并设s 和t 是M 的两个不同状态，我们说状态s,t 为某一输入串w (14) ，是指从s,t 中之一出发，当扫视完w 之后到达M 的终态，但从其中的另一个状态出发，当扫视完同一个w 后而进入 (15) 。 9．把最右推导称为（16），而把右句型称为（17）。 10．如果从状态转换图的初态出发，分别沿着一切可能的路径到达 (18) ，并

编译原理复习整理(重点含答案)

1、给出下面语言的相应文法。L1={a n b n c i|n≥1,i≥0} 从n，i的不同取值来把L1分成两部分：前半部分是anbn：A→aAb|ab后半部分是ci：B→Bc|ε所以整个文法G1[S]可以写为：G1(S):S→AB；A→aAb|ab；B→cB|ε 3、构造一个DFA，它接受 ={a，b}上所有包含ab的字符串。（要求：先将正规式转化为NFA，再将NFA确定化，最小化）

4、对下面的文法G: E →TE ’ E ’→+E|ε T →FT ’ T ’→T|ε F →PF ’ F ’ →*F ’|ε P →(E)|a|b|∧ （1）证明这个文法是LL(1)的。（2）构造它的预测分析表。 (1)FIRST(E)={(,a,b,^}FIRST(E')={+, ε}FIRST(T)={(,a,b,^}FIRST(T')={(,a,b,^,ε} FIRST(F)={(,a,b,^}FIRST(F')={*,ε}FIRST(P)={(,a,b,^}FOLLOW(E)={#,)} FOLLOW(E')={#,)}FOLLOW(T)={+,),#}FOLLOW(T')={+,),#}FOLLOW(F)={(,a,b,^,+,),#} FOLLOW(F')={(,a,b,^,+,),#}FOLLOW(P)={*,(,a,b,^,+,),#} (2)考虑下列产生式: '→+'→'→'→E E T T F F P E a b ||*|()|^||εεε FIRST(+E)∩FIRST(ε)={+}∩{ε}=φ FIRST(+E)∩FOLLOW(E')={+}∩{#,)}=φ FIRST(T)∩FIRST(ε)={(,a,b,^}∩{ε}=φ FIRST(T)∩FOLLOW(T')={(,a,b,^}∩{+,),#}=φ FIRST(*F')∩FIRST(ε)={*}∩{ε}=φ FIRST(*F')∩FOLLOW(F')={*}∩{(,a,b,^,+,),#}=φ

编译原理习题及答案(整理后)

第一章 1、将编译程序分成若干个“遍”是为了。 b．使程序的结构更加清晰 2、构造编译程序应掌握。 a．源程序b．目标语言 c．编译方法 3、变量应当。 c．既持有左值又持有右值 4、编译程序绝大多数时间花在上。 d．管理表格 5、不可能是目标代码。 d．中间代码 6、使用可以定义一个程序的意义。 a．语义规则 7、词法分析器的输入是。 b．源程序 8、中间代码生成时所遵循的是- 。 c．语义规则 9、编译程序是对。 d．高级语言的翻译 10、语法分析应遵循。 c．构词规则二、多项选择题 1、编译程序各阶段的工作都涉及到。 b．表格管理c．出错处理 2、编译程序工作时，通常有阶段。 a．词法分析b．语法分析c．中间代码生成e．目标代码生成三、填空题 1、解释程序和编译程序的区别在于是否生成目标程序。 2、编译过程通常可分为5个阶段，分别是词法分析、语法分析中间代码生成、代码优化和目标代码生成。 3、编译程序工作过程中，第一段输入是源程序，最后阶段的输出为标代码生成程序。 4、编译程序是指将源程序程序翻译成目标语言程序的程序。

一、单项选择题 1、文法G：S→xSx|y所识别的语言是。 a. xyx b. (xyx)* c. x n yx n(n≥0) d. x*yx* 2、文法G描述的语言L(G)是指。 a. L(G)={α|S+?α , α∈V T*} b. L(G)={α|S*?α, α∈V T*} c. L(G)={α|S*?α,α∈(V T∪V N*)} d. L(G)={α|S+?α, α∈(V T∪V N*)} 3、有限状态自动机能识别。 a. 上下文无关文法 b. 上下文有关文法 c.正规文法 d. 短语文法 4、设G为算符优先文法，G的任意终结符对a、b有以下关系成立。 a. 若f(a)>g(b)，则a>b b.若f(a)

编译原理结课论文

1.绪论概述 “编译原理”是一门研究设计和构造编译程序原理课程，是计算机各专业的一门重要的专业课。编译原理这门课程蕴含着计算机学科中解决问题的思路和解决问题的方法，对应用软件和系统软件的设计与开发有一定的启发和指导作用。“编译原理”是一门实践性很强的课程，要掌握这门课程中的思想，就必须要把所学到的知识应用于实践当中。而课程设计是将理论与实践相互联系的一种重要方式。设计目的课程设计是对学生的一种全面综合素质训练，是与课堂听讲、自学和练习相辅相成的必不可少的一个教学环节。通常，设计题中的问题比平时的练习题要复杂很多，但也更接近实际。编译原理这门课程安排的课程设计的目的是旨在要求学生进一步巩固课堂上所学的理论知识，深化理解和灵活掌握教学内容，选择合适的数据逻辑结构解决问题，然后编制算法和程序完成设计要求，从而进一步培养学生独立思考问题、分析问题、解决实际问题的能力。设计题目及要求基于这个学期所学习的内容以及自己所掌握到的知识，本次我所要设计的题目是赋值语句的四元式生成。

要求：（1）设计语法制导生成赋值语句的四元式的算法；（2）编写代码并上机调试运行通过；（3）输入一赋值语句；（4）输出相应的表达式的四元式； 2.背景知识语法制导翻译方法语法制导翻译的方法就是为每个产生式配上一个翻译子程序（称语义动作或语义子程序），并在语法分析的同时执行这些子程序。语义动作是为产生式赋予具体意义的手段，它一方面指出了一个产生式所产生的符号串的意义，另一方面又按照这种意义规定了生成某种中间代码应做哪些基本动作。在语法分析的过程中，当一个产生式获得匹配（对于自顶向下分析）或用于规约（对于自底向上分析）时，此产生式相应的语义子程序就进入工作，完成既定的翻译任务。语法制导翻译分为自底向上语法制导翻译和自顶向下语法制导翻译。属性文法属性文法是编译技术中用来说明程序语言语义的工具，也是当前实际应用中比较流行的一种语义描述方法。属性是指与文法符号的类型和值等有关的一些信息，在编译中用属性描述处理对象的特征。属性文法是一种

编译原理知识点汇总

编译原理的复习提纲 1.编译原理=形式语言+编译技术 2.汇编程序：把汇编语言程序翻译成等价的机器语言程序 3.编译程序：把高级语言程序翻译成等价的低级语言程序 4.解释执行方式：解释程序，逐个语句地模拟执行翻译执行方式：翻译程序，把程序设计语言程序翻译成等价的目标程序 5.计算机程序的编译过程类似，一般分为五个阶段：词法分析、语法分析、语义分析及中间代码生成、代码优化、目标代码生成词法分析的任务：扫描源程序的字符串，识别出的最小的语法单位（标识符或无正负号数等）语法分析是：在词法分析的基础上的，语法分析不考虑语义。语法分析读入词法分析程序识别出的符号，根据给定的语法规则，识别出各个语法结构。语义分析的任务是检查程序语义的正确性，解释程序结构的含义，语义分析包括检查变量是否有定义，变量在使用前是否具有值，数值是否溢出等。

语法分析完成之后，编译程序通常就依据语言的语义规则，利用语法制导技术把源程序翻译成某种中间代码。所谓中间代码是一种定义明确、便于处理、独立于计算机硬件的记号系统，可以认为是一种抽象机的程序代码优化的主要任务是对前一阶段产生的中间代码进行等价变换，以便产生速度快、空间小的目标代码编译的最后一个阶段是目标代码生成，其主要任务是把中间代码翻译成特定的机器指令或汇编程序编译程序结构包括五个基本功能模块和两个辅助模块 6.编译划分成前端和后端。编译前端的工作包括词法分析、语法分析、语义分析。编译前端只依赖于源程序，独立于目标计算机。前端进行分析编译后端的工作主要是目标代码的生成和优化后端进行综合。独立于源程序，完全依赖于目标机器和中间代码。把编译程序分为前端和后端的优点是：可以优化配置不同的编译程序组合，实现编译重用，保持语言与机器的独立性。 7.汇编器把汇编语言代码翻译成一个特定的机器指令序列第二章 1.符号，字母表，符号串，符号串的长度计算P18，子符号串的含义，符号串的简单运算XY，Xn， 2.符号串集合的概念，符号串集合的乘积运算，方幂运算，闭包与正闭包的概念P19，P20A0 ={ε} 3.重写规则，简称规则。非xx（V

编译原理课后习题答案

第1 章 1、编译过程包括哪几个主要阶段及每个阶段的功能。答案：编译过程包括词法分析、语法分析、语义分析和中间代码生成、优化、目标代码生成5 个阶段。词法分析的功能是对输入的高级语言源程序进行词法分析，识别其中的单词符号，确定它们的种类，交给语法分析器，即把字符串形式的源程序分解为单词符号串形式。语法分析的功能是在词法分析结果的基础上，运用语言的语法规则，对程序进行语法分析，识别构成程序的各类语法范畴及它们之间的层次关系，并把这种层次关系表达成语法树的形式。词义分析和中间代码生成的功能是在语法分析的基础上，对程序进行语义分析，“理解”其含义，产生出表达程序语义的内部表达形式（中间代码）。优化的功能是按照等价变换的原则，对语义分析器产生的中间代码序列进行等价变换，删除其中多余的操作，对耗时耗空间的代码进行优化，以期最后得到高效的可执行代码。目标代码生成的功能是把优化后的中间代码变换成机器指令代码，得到可在目标机器上执行的机器语言程序。第2 章 1、写一上下文无关文法G，它能产生配对的圆括号串（如：(),(()),()(())等，甚至包括0 对括号）文法为：S→(L)|LS|L L→S| ε 2 、已知文法G ：E→E+T|E-T|T T→T*F|T/F|F F→(E) |i （1）给出i+i*i,i*(i-i)的最左推导，最右推导以及语法树。（2）i-i+i 哪个算符优先。【解答】（1）最左推导：E?E+T?T+T? F+T ? i+T ? i+T*F ? i+F*F ?i+i*F ?i+i*i E?T?T*F? F*F ? i*F ? i*(E) ? i*(E-T) ? i*(T-T) ? i*(F-T) ? i*(i-T) ? i*(i-F) ?i*(i-i) 最右推导：E?E+T?E+T*F? E+T*i ? E+F*i ? E+i*i ? T+i*i ? F+i*i ? i+i*i E?T?T*F? T*(E) ? T*(E-T) ? T*(E-F) ? T*(E-i) ? T*(T-i) ? T*(F-i) ?T*(i-i) ? F*(i-i) ?i*(i-i) i+i*i 以及i*(i-i)的语法树如下所示：（2）i-i+i 的语法树如下图所示。从上图的语法树可知：“-”的位置位于“+”的下层，也就是前面两个i 先进行“-”运算，再与后面的i 进行“+” 运算，所以“-”的优先级高于“+”的优先级。 3 、文法G: E→ET+|T T→TF*|F F→FP↑|P P→E|i （1）试证明符号串TET+*i↑是G 的一个句型(要求画出语法树). （2）写出该句型的所有短语,直接短语和句柄. 【解答】（1）采用最右推导： E?T?F? FP↑? Fi↑? Pi↑? Ei↑ ? Ti↑? TF*i↑? TP*i↑? TE*i↑? TET+*i↑ 语法树如下图所示。从文法G 的起始符号出发，能够推导出符号串TET+*i↑，所以给定符号串是文法G的句型。 (2) 该句型的短语有： ET+,TET+*,i ,TET+*i↑ 直接短语有：ET+, i 句柄是：ET+ 4、已知文法G：S→iSeS|iS|i ，该文法是二义文法吗？为什么？【解答】该文法是二义文法。因为对于句子iiiei 存在两种不同的最左推导：第 1 种推导：S? iSeS? iiSeS? iiieS? iiiei 第2种推导：S?iS?iiSeS?iiieS?iiiei 第3 章 1、用正规式描述下列正规集：（1）C 语言的十六进制整数；（2）以ex 开始或以ex 结束的所有小写字母构成的符号串；（3）十进制的偶数。【解答】（1）C 语言十六进制整数以0x 或者0X 开头，所以一般形式应该为（+|-|ε） (0x|0X)AA*，其中前面括号表示符号，可以有正号、负号，也可以省略（用ε表示）默认是正数，A 表示有资格出现在十六进制整数数位上的数字，AA*表示一位或者多位（一个或者多个数字的

编译原理学习心得

编译原理学习心得编译原理学习心得1 编译程序在计算机科学与技术的发展历史中发挥了巨大作用，是计算机系统的核心支撑软件。而“编译原理”这门课程一直以来是国内外大学计算机相关专业的重要课程。因为它的知识结构贯穿程序设计语言、系统环境以及体系结构，能以相对的视角体现从软件到硬件以及软硬件协同的整机概念。其理论基础又涉及形式语言与自动机、数据结构与算法等计算机学科的许多重要方面，为联系计算机科学理论和计算机系统的典范。虽然编译原理这门课程在大多数的人里认为枯燥无味，学起来就像看天书一样。然而学习这门课程还是有一定的好处的。比如可以更加容易的理解在一个语言种哪些写法是等价的，哪些是有差异的，可以更加客观的比较不同语言的差异，并且学习新的语言的效率也会更加高，语言转换也会更加游刃有余。不学“编译原理”这门课程的话，自己的编程思想会很浅显。而且编程也只仅仅停留在编程上，无法深入理解其中的原理。学习编译原理的话，从文法、正规式、NFA与DFA的定义，下手，要用心动脑去体会编译原理学习心得2

从联系最紧密的操作系统来说吧，你写多线程/多进程的程序就得和操作系统的知识打交道。写多线程得加锁吧，临界区、死锁的四个条件之类的标准的操作系统的内容吧(不得不吐槽一下，某国内一线电商干了三年的程序猿，写多线程居然不知道加锁，也是醉了)。进程间通信的几种方式什么管道、socket、共享内存等，这也是操作系统的内容吧。文件系统，这也是经常要打交道的东西。还有内存什么的，你做Android 开发，这些里边有很多东西都在系统层面被封装好了，但是你要是不知道原理，一旦出了错根本无从调试，况且你该不会打算写一辈子写Android 就是填逻辑吧。然后，是编译原理，普通的程序猿是接触不到编译器或者虚拟机的开发的。但是这并不意味着编译原理就用不到。说个最常见的读取配置文件，只要你的配置文件有自定义的语法，你就要用编译原理的东西。还有类似于自动生成代码啦、正则表达式啦这些都算是编译原理的内容。你既然是写Java 的不了解虚拟机怎么可以，最基本的字节码总是需要能看懂的吧，分析一些疑难杂症的时候字节码还是很有用的。最后，是计算机原理，如果只是做应用开发的话计算机原理其实不必要掌握的多深入，但是一些基本的概念还是要清楚的。比如寄存器、缓存、中断什么的，关键的时候可以帮助你调试。在一些对性能要求非常高的场合，也是很有作用的。此外，学了

编译原理概念期末总结复习

翻译程序:把一种语言程序转换成另一种语言程序，且在功能上是相同的这样的程序。编译程序：把高级语言转换成低级语言，且在功能上是相同的这样的程序。解释程序：边解释边执行源程序的程序。区别：编译程序有中间代码，而解释程序没有。编译过程的五个阶段： 1、词法分析任务：对构成源程序的字符串进行扫描和分解，识别出一个个单词。 2、语法分析任务：在词法分析的基础上，根据语言规则，把单词符号串分解成各类语法单位。 3、语义分析和中间代码产生任务：对语法分析所识别出的各类语法范畴，分析其含义，并进行初步翻译。 4、优化任务：对前段产生的中间代码进行加工变换，以期在最后阶段能产生出更为高效的目标代码。 5、目标代码生成任务：把中间代码变换成特定机器上的低级语言代码。编译程序的七个部分词法分析器，语法分析器、语义分析与中间代码产生器、优化器、目标代码生成器、表格管理和出错处理。编译程序生成的五个办法：机器语言、高级语言、移植、自编译方式和使用工具自动生成。词法规则：指单词符号的形成规则。（也就是正规式）语法规则：规定了如何从单词符号形成更大的结构。就是语法单位的形成规则。空字：不包含任何符号的序列。闭包：中所有的符号组成的集合。上下文无关文法是指：所定义的语法范畴是完全独立于这种范畴可能出现的环境的文法。上下文无关文法的四个组成部分：一组终结符号、一组非终结符号、一个开始符号和一组产生式。终结符号也就是不可再分的基本符号。非终结符号是用来代表语法范畴，表示一定符号串的集合。开始符号是语言中我们最感兴趣的语法范畴。产生式是定义语法范畴的书写规则。句子：文法中从开始符号推导的终结符号串。句型：从开始符号推导的符号串。语言：文法中所有句子的集合。程序语言的单词符号分为五种：关键字、标识符、常数、运算符和界符。二元式表示：（种类，属性）正规式的运算符有三种：或，连接和闭包。优先顺序是：闭包，连接，或。 DFA怎么识别字：若存在一条从初态结点到某一终态结点的通路，且这条通路上所有弧的标记符连接成的字是a，则称a可为DFA所识别。 DFA怎么识别空字：若DFA的初态结点同时又是终态结点，则空字可为DFA所识别。NFA怎么识别字：若存在一条从某一初态结点到终态结点的通路，且这条通路上所有弧的标记字依序连接成的字等于a，则称a可为NFA识别。 NFA怎么识别空字：若M的某些结点即是初态又是终态结点，或者存在一条从某个初态结点到某个终态结点的空通路，那么，空字可为M所识别。语言的语法结构是用上下文无关文法描述的。语法分析分为两类：自上而下分析法，自下而上分析法。自上而下分析法面临的问题：1.文法的左递归问题。2.回溯3.成功可能是暂时的，产生虚假匹配。4.难于知道输入串中出错的确切位置。5.效率低，代价高。

编译原理中重点整理

1.翻译程序：将某一种语言（源语言）程序转换为与其逻辑上等价的另一种语言（目标语言）程序。编译程序：源语言为高级语言，目标语言为汇编语言或机器语言的翻译程序。汇编程序：源语言为汇编语言，目标语言为机器语言的翻译程序。解释程序：源语言程序作为输入，但不产生目标程序，而是边解释边执行源程序本身。 2.解释器与编译器的主要区别在于：运行目标程序时的控制权在解释器而不在目标程序。 3.编译程序的工作过程可划分五个阶段： ①词法分析：从左到右一个字符一个字符的读入源程序，对构成源程序的字符串进行扫描和分解，从而识别出一个个单词（也称单词符号或简称符号） ②语法分析：在词法分析的基础上将单词序列分解成各类语法短语，如“程序”，“语句”， “表达式”等等 ③语义分析和中间代码生成：语义分析是在语法分析程序确定出语法短语后，审查有无语义错误，并为代码生成阶段收集类型信息。完成语法分析和语义处理工作后，编译程序将源程序变成一种内部表示形式，这种内部表示形式叫做中间语言或称中间代码，它是一种结构简单、含义明确的记号系统。 ④代码优化：为了使生成的目标代码更为高效，可以对产生的中间代码进行变换或进行改造，这就是代码的优化。 ⑤目标代码生成：目标代码生成阶段的任务就是是把中间代码变换成特定机器上的绝对指令代码或可重定位的指令代码或汇编指令代码。 4.前端(Front-End)——与目标机无关的部分后端(Back-End )——与目标机有关的部分 5.编译系统：编译程序与运行系统合称编译系统 6.遍：对源程序或源程序的中间结果从头到尾扫描一次，并做有关的加工处理，生成新的中间结果或目标程序。 7.文法是一个四元组：G[S]=(VN, VT, P, S) VN：非终结符集合； VT ：终结符集合； P ：产生式集合（α→β或α∷=β）； S ：开始符号(或称根符号，识别符号)。若S ->α,α∈V*，则称α为文法G的句型若S ->α,α,α∈VT*，则称α为文法G的句子语言是所有句子构成的集合，它是所有终结符号串所组成的集合VT*的子集，即L(G) VT* 8.0型文法又叫短语文法，它所确定的语言称为0型语言。 1型文法,上下文敏感文法或上下文有关文法。 2型文法,上下文无关文法 3型文法线性文法、正则文法或正规文法规范(最右)推导即任何一步α->β都是对α中的最右非终结符进行替换的，规范(最左)归约文法可唯一地确定一个语言子树与短语：在句型所对应的语法树中，若某些符号按从左到右的顺序组成某棵子树的末端结点，那么由这些末端结点所组成的符号串是相对于子树根结点的短语。原则上语法树有多少棵子树，就有多少个短语。

编译原理一些习题答案

第2章形式语言基础 2.2 设有文法G[N]: N -> D | ND D -> 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 (1)G[N]定义的语言是什么? (2)给出句子0123和268的最左推导和最右推导。解答： (1)L(G[N])={(0|1|2|3|4|5|6|7|8|9)+} 或L(G[N])={α| α为可带前导0的正整数} (2) 0123的最左推导：N ? ND ? NDD ? NDDD ? DDDD ? 0DDD ? 01DD ? 012D ? 0123 0123的最右推导：N ? ND ? N3 ? ND3 ? N23 ? ND23 ? N123 ? D123 ? 0123 268的最左推导：N ? ND ? NDD ? DDD ? 2DDD ? 26D ? 268 268的最右推导：N ? ND ? N8 ? ND8 ? N68 ? D68 ? 268 2.4 写一个文法，使其语言是奇数的集合，且每个奇数不以0开头。解答：首先分析题意，本题是希望构造一个文法，由它产生的句子是奇数，并且不以0开头，也就是说它的每个句子都是以1、3、5、7、9中的某个数结尾。如果数字只有一位，则1、3、5、7、9就满足要求，如果有多位，则要求第1位不能是0，而中间有多少位，每位是什么数字（必须是数字）则没什么要求，因此，我们可以把这个文法分3部分来完成。分别用3个非终结符来产生句子的第1位、中间部分和最后一位。引入几个非终结符，其中，一个用作产生句子的开头，可以是1－9之间的数，不包括0，一个用来产生句子的结尾，为奇数，另一个则用来产生以非0整数开头后面跟任意多个数字的数字串，进行分解之后，这个文法就很好写了。 N -> 1 | 3 | 5 | 7 | 9 | BN B -> 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | B0 2.7 下面文法生成的语言是什么？ G1： S->AB A->aA| εB->bc|bBc G2： S->aA|a A->aS 解答： B ? bc B ? bBc? bbcc B ? bBc? bbBcc ? bbbccc …… A ?ε A ? aA ? a A ? aA ? aaA ? aa …… ∴S ? AB ? a m b n c n , 其中m≥0,n≥1即L(G1)={ a m b n c n | m≥0,n≥1} S ? a S ? aA ? aaS ? aaa S ? aA ? aaS ? aaaA ?aaaaS ? aaaaa …… ∴S ? a2n+1 , 其中n≥0 即L(G2)={ a2n+1 | n≥0} 2.11 已知文法G[S]: S->(AS)|(b) A->(SaA)|(a) 请找出符号串(a)和(A((SaA)(b)))的短语、简单短语和句柄。

(2020年整理)编译原理期末总复习题(含答案).doc

第八节习题一、单项选择题 1、将编译程序分成若干个“遍”是为了 b 。 a．提高程序的执行效率 b．使程序的结构更加清晰 c．利用有限的机器内存并提高机器的执行效率 d．利用有限的机器内存但降低了机器的执行效率 2、构造编译程序应掌握 d 。 a．源程序b．目标语言 c．编译方法d．以上三项都是 3、变量应当 c 。 a．持有左值b．持有右值 c．既持有左值又持有右值d．既不持有左值也不持有右值 4、编译程序绝大多数时间花在 b 上。 a．出错处理b．词法分析 c．目标代码生成d．管理表格 5、 d 不可能是目标代码。 a．汇编指令代码b．可重定位指令代码 c．绝对指令代码d．中间代码 6、使用 a 可以定义一个程序的意义。 a．语义规则b．词法规则 c．产生规则d．词法规则 7、词法分析器的输入是 a 。 a．单词符号串b．源程序 c．语法单位d．目标程序 8、中间代码生成时所遵循的是- d 。 a．语法规则b．词法规则 c．语义规则d．等价变换规则 9、编译程序是对 d 。 a．汇编程序的翻译b．高级语言程序的解释执行 c．机器语言的执行d．高级语言的翻译 10、语法分析应遵循 b 。 a．语义规则b．语法规则 c．构词规则d．等价变换规则解答 1、将编译程序分成若干个“遍”是为了使编译程序的结构更加清晰，故选b。 2、构造编译程序应掌握源程序、目标语言及编译方法等三方面的知识，故选d。 3、对编译而言，变量既持有左值又持有右值，故选c。 4、编译程序打交道最多的就是各种表格，因此选d。 5、目标代码包括汇编指令代码、可重定位指令代码和绝对指令代码3种，因此不是目标代码的只能选d。 6、词法分析遵循的是构词规则，语法分析遵循的是语法规则，中间代码生成遵循的是语义规则，并且语义规则可以定义一个程序的意义。因此选a。 7、b 8、c 9、d 10、c 二、多项选择题

编译原理概念总结

第一章引论 ? 为什么要用编译器 ? 与编译器相关的程序 ? 翻译步骤 ? 编译器中的主要数据结构 1、语言处理器 1、简单的说，一个编译器就是一个程序，它可以阅读以某一种语言（源语言）编写的程序，并把该程序翻译成一个等价的、用另一种语言（目标语言）编写的程序。 2、编译器的重要任务之一就是报告它在翻译过程中发现的源程序中的错误。 3、使用编译器是为了提高编程的速度和准确度。 4、与编译器相关的程序：解释程序（interpreter ）、汇编程序（assembler ）、连接程序（linker ）、装入程序（loader ）、预处理器（preprocessor ）、编辑器（editor ）、调试程序（debugger ）、描述器（profiler ）、项目管理程序（project manager ）。 5、解释器是另一种常见的语言处理器。它并不通过翻译的方法生成目标程序。从用户的角度来看，解释器直接利用用户提供的输入执行源程序中指定的操作。 6、一个源程序可能被分割成多个模块，并存放于独立的文件中。把源程序聚合在一起的任务有时会由一个被称为预处理器（preprocessor ）的程序独立完成。预处理器还负责把那些称为宏的缩写形式转换为源语言的语句。 7、连接器（linker ）能够解决外部内存地址的问题。 8、加载器（loader ）把所有的可执行目标文件放到内存中执行。 2、一个编译器的结构 Output Source Program Front end Back end Object

1、将编译器看成黑盒，则源程序映射为在语义上等价的目标程序，而这个映射由两部分组成：分析部分和综合部分。 2、分析部分把源程序分解成多个组成要素，并在这些要素之上加上语法结构。 3、综合部分根据中间表示和符号表中的信息来构造用户期待的目标程序。 4、编译器的第一个步骤：词法分析（lexical）或扫描（scanning）。词法分析器读入组成源程序的字符流，并且将它们组成有意义的词素（lexeme）的序列。词法分析器产生词法单元（token）。 5、分隔词素的空格会被词法分析器忽略掉。 6、编译器的第二个步骤：语法分析（syntax）或解析（parsing）。语法分析器使用由词法分析器生成的各个词法单元的第一个分量来创建树形的中间表示。 7、语义分析（static semantic analysis）：语义分析器使用语法树和符号表中的信息来检查源程序是否和语言定义的语义一致。它同时也收集类型信息，并把这些信息存放在语法树或符号表中，以便在随后的中间代码生成过程中使用。语义分析的一个重要部分是类型检查（type checking）。编译器检查每个运算符是否具有匹配的运算分量。 8、总的说，编译器的翻译步骤是：扫描程序----语法分析程序----语义分析程序---- 源代码优化程序----代码生成器----目标代码优化程序。 3、编译器结构中的主要数据结构 1、记号（token） 2、语法树（syntax tree） 3、符号表（symbol table） 4、常数表（literal table） 5、中间代码（intermediate code） 6、临时文件（temporary file） 4、将编译器分成了只依赖于源语言（前端（ front end））的操作和只依赖于目标语言（后端（ back end））的操作两部分。第二章词法分析 ? 扫描处理 ? 正则表达式 ? 有穷自动机 ? 从正则表达式到D FA ? 利用L e x自动生成扫描程序 1、Tokens记号标记：identifiers、keywords、integers、floating-point、symbols、strings、comments 1、使用正则表达式去描述程序语言tokens 2、一个正则表达式是归纳确定 3、一个正则表达式R描述一组字符串集合L(R) 4、L(R) = the language defined by R 5、所有的token都能用正则表达式表示 2、正则表达式： 1、基本正则表达式：他们是字母比哦啊中的单个字符且自身匹配