程序设计语言与编译-编译原理_数据类型

编译原理

致谢： 2005级周朝丽、丛志环、张云华、周娇、陈亮、陶锌、张世强等同学不仅对讲义的进一步完善提出了宝贵的意见和建议，而且提出的许多富有探讨性的问题，不仅令我进一步思考，同时也令讲义的许多内容进一步丰富，在此，本人、现在已经看到、未来将会看到该讲义的人对各位的“答疑解惑”表示由衷的谢意！参考书目： 1.编译原理，Alfred V. Aho, Ravi Sethi, Jeffrey D. Ullman著，李建中，姜守旭译。机械工业出版社，2003 Compilers Principles, Techniques, and Tools（英文版名字） 2.编译原理及实践，（美）Kenneth C. Louden著，冯博琴等译。机械工业出版社，2000 Compiler Construction: Principles and Practice （英文版名字） 3.编译原理习题与解析(第2版)/伍春香编著-.--北京:清华大学出版社,2006 4.编译原理=Compiling Principle/周经野，张继福主编-.--武汉:武汉理工大学出版社,2003 5.程序设计语言编译方法. 肖军模编著. 大连理工大学出版社，2000。 6.程序设计语言编译原理/陈火旺等编.--北京:国防工业出版社,1984 7.编译方法/金成植编.--北京:高等教育出版社,1984 8.编译原理/蒋立源主编.--西安:西北工业大学出版社,1993.8 9.编译原理和技术/陈意云, 马万里编译.--安徽:中国科学技术大学出版社,1989.12 10.编译原理及其习题解答/何炎祥...[等]编著-.--武汉:武汉大学出版社,2004。 11.形式语言与自动机理论 12.FORTRAN语言程序设计，谭浩强、田淑清编著，高等教育出版社，1987年5月。 13.PASCAL程序设计，郗曼丽编著，陕西科学技术出版社。 14.讲义的一些部分来源于互联网上的多种资源，其链接难以一一提供，在此，谨向大家致以真诚地敬意和诚挚的谢意，感谢大家通过互联网提供的极为有益的帮助和指导。 1

编译原理知识点汇总

编译原理的复习提纲 1.编译原理=形式语言+编译技术 2.汇编程序：把汇编语言程序翻译成等价的机器语言程序 3.编译程序：把高级语言程序翻译成等价的低级语言程序 4.解释执行方式：解释程序，逐个语句地模拟执行翻译执行方式：翻译程序，把程序设计语言程序翻译成等价的目标程序 5.计算机程序的编译过程类似，一般分为五个阶段：词法分析、语法分析、语义分析及中间代码生成、代码优化、目标代码生成词法分析的任务：扫描源程序的字符串，识别出的最小的语法单位（标识符或无正负号数等）语法分析是：在词法分析的基础上的，语法分析不考虑语义。语法分析读入词法分析程序识别出的符号，根据给定的语法规则，识别出各个语法结构。语义分析的任务是检查程序语义的正确性，解释程序结构的含义，语义分析包括检查变量是否有定义，变量在使用前是否具有值，数值是否溢出等。

语法分析完成之后，编译程序通常就依据语言的语义规则，利用语法制导技术把源程序翻译成某种中间代码。所谓中间代码是一种定义明确、便于处理、独立于计算机硬件的记号系统，可以认为是一种抽象机的程序代码优化的主要任务是对前一阶段产生的中间代码进行等价变换，以便产生速度快、空间小的目标代码编译的最后一个阶段是目标代码生成，其主要任务是把中间代码翻译成特定的机器指令或汇编程序编译程序结构包括五个基本功能模块和两个辅助模块 6.编译划分成前端和后端。编译前端的工作包括词法分析、语法分析、语义分析。编译前端只依赖于源程序，独立于目标计算机。前端进行分析编译后端的工作主要是目标代码的生成和优化后端进行综合。独立于源程序，完全依赖于目标机器和中间代码。把编译程序分为前端和后端的优点是：可以优化配置不同的编译程序组合，实现编译重用，保持语言与机器的独立性。 7.汇编器把汇编语言代码翻译成一个特定的机器指令序列第二章 1.符号，字母表，符号串，符号串的长度计算P18，子符号串的含义，符号串的简单运算XY，Xn， 2.符号串集合的概念，符号串集合的乘积运算，方幂运算，闭包与正闭包的概念P19，P20A0 ={ε} 3.重写规则，简称规则。非xx（V

实验1-3 《编译原理》词法分析程序设计方案

实验1-3 《编译原理》S语言词法分析程序设计方案一、实验目的了解词法分析程序的两种设计方法之一：根据状态转换图直接编程的方式；二、实验内容 1．根据状态转换图直接编程编写一个词法分析程序，它从左到右逐个字符的对源程序进行扫描，产生一个个的单词的二元式，形成二元式（记号）流文件输出。在此，词法分析程序作为单独的一遍，如下图所示。具体任务有：（1）组织源程序的输入（2）拼出单词并查找其类别编号，形成二元式输出，得到单词流文件（3）删除注释、空格和无用符号（4）发现并定位词法错误，需要输出错误的位置在源程序中的第几行。将错误信息输出到屏幕上。（5）对于普通标识符和常量，分别建立标识符表和常量表（使用线性表存储），当遇到一个标识符或常量时，查找标识符表或常量表，若存在，则返回位置，否则返回0并且填写符号表或常量表。标识符表结构：变量名，类型（整型、实型、字符型），分配的数据区地址注：词法分析阶段只填写变量名，其它部分在语法分析、语义分析、代码生成等阶段逐步填入。常量表结构：常量名，常量值三、实验要求 1．能对任何S语言源程序进行分析在运行词法分析程序时，应该用问答形式输入要被分析的S源语言程序的文件名，然后对该程序完成词法分析任务。 2．能检查并处理某些词法分析错误词法分析程序能给出的错误信息包括：总的出错个数，每个错误所在的行号，错误的编号及错误信息。本实验要求处理以下两种错误（编号分别为1，2）： 1：非法字符：单词表中不存在的字符处理为非法字符，处理方式是删除该字符，给出错误信息，“某某字符非法”。 2：源程序文件结束而注释未结束。注释格式为：/* …… */ 四、保留字和特殊符号表

编译原理习题及答案(整理后)

第一章 1、将编译程序分成若干个“遍”是为了。 b．使程序的结构更加清晰 2、构造编译程序应掌握。 a．源程序b．目标语言 c．编译方法 3、变量应当。 c．既持有左值又持有右值 4、编译程序绝大多数时间花在上。 d．管理表格 5、不可能是目标代码。 d．中间代码 6、使用可以定义一个程序的意义。 a．语义规则 7、词法分析器的输入是。 b．源程序 8、中间代码生成时所遵循的是- 。 c．语义规则 9、编译程序是对。 d．高级语言的翻译 10、语法分析应遵循。 c．构词规则二、多项选择题 1、编译程序各阶段的工作都涉及到。 b．表格管理c．出错处理 2、编译程序工作时，通常有阶段。 a．词法分析b．语法分析c．中间代码生成e．目标代码生成三、填空题 1、解释程序和编译程序的区别在于是否生成目标程序。 2、编译过程通常可分为5个阶段，分别是词法分析、语法分析中间代码生成、代码优化和目标代码生成。 3、编译程序工作过程中，第一段输入是源程序，最后阶段的输出为标代码生成程序。 4、编译程序是指将源程序程序翻译成目标语言程序的程序。

一、单项选择题 1、文法G：S→xSx|y所识别的语言是。 a. xyx b. (xyx)* c. x n yx n(n≥0) d. x*yx* 2、文法G描述的语言L(G)是指。 a. L(G)={α|S+?α , α∈V T*} b. L(G)={α|S*?α, α∈V T*} c. L(G)={α|S*?α,α∈(V T∪V N*)} d. L(G)={α|S+?α, α∈(V T∪V N*)} 3、有限状态自动机能识别。 a. 上下文无关文法 b. 上下文有关文法 c.正规文法 d. 短语文法 4、设G为算符优先文法，G的任意终结符对a、b有以下关系成立。 a. 若f(a)>g(b)，则a>b b.若f(a)

程序设计语言习题与答案

第六章习题 P159-161 一、复习题 1、简述自然语言与形式语言的概念以及区别、汇编语言与机器语言的概念及区别。自然语言是某一社会发展中形成的一种民族语言，而形式语言是进行形式化工作的元语言，它是以数学和数理逻辑为基础的科学语言。用机器指令形式编写的程序称为机器语言，用带符号或助记符的指令和地址代替二进制代码成为语言进化的目标。这些使用助记符语言的语言后来就被称之为汇编语言。（P144- P146） 2、试述计算机语言的类型，它们各有什么特点？ 1.机器语言，是最低级的语言，由二进制码组成，最早期的程序员通过在纸带上打点来写程序 2.汇编语言，用助记符和地址符代替了二进制码，更易于编写。 3.高级语言，相对于汇编语言又上升了一步，更接近于自然语言，如C语言、Pascal、Java、C#等都是高级语言。（P145-147） 3、列举程序设计语言的几种范型。程序语言大致分为命令式程序设计语言、面向对象的程序设计语言、函数式程序设计语言和逻辑型程序设计语言等范型。（P147-149） 4、简述语言虚拟机。提示：语言虚拟机是某种语言的解释器。语言虚拟机是建立在硬件和操作系统之上，针对不同的硬件和操作系统有不同的虚拟机，通过语言虚拟机屏蔽掉硬件的差异。这样使得硬件系统能够支持这种语言编写的程序的有效执行。目前最流行的语言虚拟机是Java虚拟机。（P156） 5、计算机执行用高级语言编写的程序有哪些途径？它们之间的主要区别是什么？提示：主要有编译、解释等方式，也有两种方式的混合使用的形式。编译是使用编译器将高级语言编写的源程序转换成计算机可以执行的机器语言可执行程序，也可以理解为用编译器产生可执行程序的动作。编译方式是一次编译，然后执行程序可以反复多次执行。解释是另一种将高级语言转换为可执行程序的方式。与编译不同，解释性语言的程序不需要编译，省了道工序，解释性语言在运行程序的时候才翻译，每个语句都是执行的时候才翻译。这样解释性语言每执行一次就要翻译一次，效率比较低。近来随着网络的发展，为了实现跨平台但同时又保证一定的效率，出现了编译、解释混合的方式，先用伪编译形成效率较高中间代码，再用语言虚拟机进行解释执行，以屏蔽掉硬件的差异。 (P154-157) 6、请画出编译程序的总框图。如果你是一个编译程序的总设计师，设计编译程序时应当考虑哪些问题？作为一个编译程序的总设计师，首先要深刻理解被编译的源语言其语法及语义；其次，

(完整版)高级语言与编译程序概述自测题

第一章高级语言与编译程序概述一、单项选择题 1.将编译程序分成若干个“遍”是为了＿＿＿＿。 A. 提高程序的执行效率 B. 使程序的结构更加清晰 C. 利用有限的机器内存并提高机器的执行效率 D. 利用有限的机器内存但降低了机器的执行效率 2.构造编译程序应掌握＿＿＿＿。 A. 源程序 B. 目标语言 C. 编译方法 D. 以上三项都是 3.编译程序绝大多数时间花在＿＿＿＿上。 A. 出错处理 B. 词法分析 C. 目标代码生成 D. 管理表格 4. ＿＿＿＿不可能是目标代码。 A. 汇编指令代码 B. 可重定位指令代码 C. 绝对指令代码 D. 中间代码 5.使用＿＿＿＿可以定义一个程序的意义。 A. 语义规则 B. 词法规则 C. 产生规则 D. 左结合规则 6.词法分析器的输入是＿＿＿＿。 A. 单词符号 B. 源程序 C. 语法单位 D. 目标程序 7.中间代码生成时所遵循的是＿＿＿＿。 A. 语法规则 B. 词法规则 C. 语义规则 D. 等价变换规则 8.编译程序是对＿＿＿＿。 A. 汇编程序的翻译 B. 高级语言程序的解释执行 C. 机器语言的执行 D. 高级语言的翻译 9.词法分析应遵循＿＿＿＿。 A. 语义规则 B. 语法规则 C. 构词规则 D. 等价变换规则 10.若源程序是高级语言编写的程序，目标程序是＿＿＿＿，则称它为编译程序。 A. 汇编语言程序或高级语言程序 B. 高级语言程序或机器语言程序 C. 汇编语言程序或机器语言程序 D. 连接程序或运行程序 11.编译过程中，词法分析阶段的任务是＿＿＿＿。 A.识别表达式 B. 识别语言单词 C. 识别语句 D. 识别程序二、多项选择题： 1.编译程序各阶段的工作都涉及到＿＿＿＿。 A. 语法分析 B. 表格管理 C. 出错处理 D. 语义分析 E. 词法分析 2.如果编译程序生成的目标程序是机器代码程序，则源程序的执行分为两大阶段：＿＿＿＿和＿＿＿＿。 A. 编译阶段 B. 汇编阶段 C. 运行阶段 D. 置初值阶段 3.编译程序工作时, 通常有＿＿＿＿阶段。 A.词法分析 B. 语法分析 C. 中间代码生成 D. 语义检查 E. 目标代码生成 F.出错处理 G.表格管理 4.编译过程中所遵循的规则有＿＿＿＿。 A.等价变换规则 B. 短语规则 C. 构词规则 D. 语义规则 E. 语法规则三、填空题： 1.解释程序和编译程序的区别在于＿＿＿＿＿＿＿＿。 2.编译过程通常可分为5 个阶段，分别是＿＿＿＿、语法分析、＿＿＿＿、代码优化和目标代码生成。

程序设计语言编译原理第3课后答案

第二章 P36-6 (1) L G ()1是0~9组成的数字串 (2) 最左推导: N ND NDD NDDD DDDD DDD DD D N ND DD D N ND NDD DDD DD D ??????????????????0010120127334 556568 最右推导: N ND N ND N ND N D N ND N D N ND N ND N D ??????????????????77272712712701274434 886868568 P36-7 G(S) O N O D N S O AO A AD N →→→→→1357924680||||||||||| P36-8 文法： E T E T E T T F T F T F F E i →+-→→|||*|/()| 最左推导: E E T T T F T i T i T F i F F i i F i i i E T T F F F i F i E i E T i T T i F T i i T i i F i i i ?+?+?+?+?+?+?+?+??????+?+?+?+?+?+********()*()*()*()*()*()*() 最右推导: E E T E T F E T i E F i E i i T i i F i i i i i E T F T F F F E F E T F E F F E i F T i F F i F i i i i i ?+?+?+?+?+?+?+?+?????+?+?+?+?+?+?+**********()*()*()*()*()*()*()*() 语法树：/********************************

编译原理论文

《编译原理》课程论文编译程序是现代计算机系统的基本组成部分之一，而且多数计算机系统都配有不止一个高级语言的编译程序，对有些高级语言甚至配置了几个不同性能的编译程序。从功能上讲，一个编译程序就是一个语言翻译程序。语言翻译程序把一种源语言书写的程序翻译成另一种目标语言的等价程序，所以总的说编译程序是一种翻译程序，其源程序是高级语言，目标语言程序是低级语言。编译程序完成从源程序到目标程序的翻译工作，是一个复杂的整体的过程。从概念上来讲，一个编译程序的整个工作过程是划分成几个阶段进行的，每个阶段将源程序的一种表示形式转换成另一种表示形式，各个阶段进行的操作在逻辑上是紧密连接在一起的。一般一个编译过程是词法分析、语法分析、语义分析、中间代码生成、代码优化和目标代码生成。编写编译器的原理和技术具有十分普遍的意义，以至于在每个计算机工作者的职业生涯中，本书中的原理和技术都会反复用到。在这本书中，向我们介绍了文法的概念，在讲词法分析的章节中讲述了构造一个有穷自动机的方法，以及如何将一个不确定的有穷自动机转化成确定的有穷自动机和有穷自动机的最小化等方法。词法分析相对来说比较简单。可能是词法分析程序本身实现起来很简单吧，很多没有学过编译原理的人也同样可以写出各种各样的词法分析程序。不过编译原理在讲解词法分析的时候，重点把正则表达式和自动机原理加了进来，然后以一种十分标准的方式来讲解词法分析程序的产生。这样的做法道理很明显，就是要让词法分析从程序上升到理论的地步。词法分析中的重点是有穷自动机DFA的生成以及DFA和正规式与正规文法的关系。还要熟练掌握NFA转换为DFA的方法及DFA的化简。词法分析的核心应该是构建DFA，最后维护一个状态转移表。通过转态转移的结果来识别词性。DFA的思想和字典树很像。NFA通过求每个状态的闭包后构造出的自动机与DFA等价。正则表达式闭包，连接，或三种操作都有相应的NFA与其等价。所以正则表达式==NFA==DFA。DFA状态最小化算法化简DFA。LL(1)文法主要就是根据FIRST集判断向哪条路径走，来避免回溯；LR(0)文法构造项

编译原理课程设计 C语言编译器的实现

编译原理课程设计报告设计题目编译代码生成器设计学生姓名班级学号指导老师成绩

一、课程设计的目的编译原理课程兼有很强的理论性和实践性，是计算机专业的一门非常重要的专业基础课程，它在系统软件中占有十分重要的地位，是计算机专业学生的一门主修课。为了让学生能够更好地掌握编译原理的基本理论和编译程序构造的基本方法和技巧，融会贯通本课程所学专业理论知识，提高他们的软件设计能力，特设定该课程的课程设计，通过设计一个简单的PASCAL语言（EL语言）的编译程序，提高学生设计程序的能力，加深对编译理论知识的理解与应用。二、课程设计的要求 1、明确课程设计任务，复习编译理论知识，查阅复印相关的编译资料。 2、按要求完成课程设计内容，课程设计报告要求文字和图表工整、思路清晰、算法正确。 3、写出完整的算法框架。 4、编写完整的编译程序。三、课程设计的内容课程设计是一项综合性实践环节，是对平时实验的一个补充，课程设计内容包括课程的主要理论知识，但由于编译的知识量较复杂而且综合性较强，因而对一个完整的编译程序不适合平时实验。通过课程设计可以达到综合设计编译程序的目的。本课程的课程设计要求学生编写一个完整的编译程序，包括词法分析器、语法分析器以及实现对简单程序设计语言中的逻辑运算表达式、算术运算表达式、赋值语句、IF语句、While语句以及do…while语句进行编译，并生成中间代码和直接生汇编指令的代码生成器。四、总体设计方案及详细设计总体设计方案： 1.总体模块主程序词法分析程序语法分析程序中间代码生成程序

2. 表2.1 各种单词符号对应的种别码单词符号种别码单词符号种别码bgin 1 ：17 If 2 ：= 18 Then 3 < 20 wile 4 <> 21 do 5 <= 22 end 6 > 23 lettet（letter|digit）* 10 >= 24 dight dight* 11 = 25 + 13 ；26 —14 ( 27 * 15 ) 28 / 16 # 0 详细设计： 4.1界面导入设计 (1)一共三个选项： ①choice 1--------cifafenxi ②choice 2--------yufafenxi ③choice 3--------zhongjiandaima (2)界面演示图一

程序设计语言编译原理考试重点

第一章引论 1.编译程序分几个阶段，每个阶段的任务是什么？五个阶段：词法分析、语法分析、语义分析、中间代码生成、优化、目标代码生成词法分析任务：输入源程序，对构成源程序的字符串进行扫描和分解，识别出一个个的单词。(如基本字，标识符，常数，算符和界符)。语法分析任务：在词法分析基础上，将单词符号串转化为语法单位(语法范畴) (短语、子句、句子、程序段、程序)，并确定整个输入串是否构成语法上正确的程序。语义分析和中间代码生成任务：对语法分析所识别出的各类语法范畴，分析其含义，并进行初步翻译(产生中间代码) 。代码优化任务：对于代码(主要是中间代码)进行加工变换，以期能够产生更为高效(省时间和空间)的目标代码。目标代码生成任务：将中间代码变换成特定机器上的低级语言代码 2.表格管理和出错处理：编译各阶段均须维持表格并进行表格管理，建表的技术支持是数据结构，表格的分类、结构、处理方法决定于语言及机器，还有优化措施。一个好的编译程序应该：全，最大限度发现错误；准，准确指出错误的性质和发生地点；局部化，将错误的影响限制在尽可能小的范围内。源程序中的错误通常分为：语法错误，不符合语法(或词法)规则的错误，如单词拼写错误、括号不匹配…语义错误，不符合语义规则的错误，如说明错误、作用域错误、类型不匹配… 3.前端、后端：编译前端主要由与源语言有关，但与目标机无关的那些部分组成。编译后端包括编译程序中与目标机有关的那些部分。 4.遍：根据系统资源的状况、运行目标的要求……等，可以将一个编译程序设计成多遍扫描的形式，在每一遍扫描中，完成不同的任务。遍可以和阶段相对应，也可无关。单遍代码不太有效。遍是对源程序或源程序的中间结果从头到尾扫描一次，并作有关的加工处理，生成新的中间结果或目标程序。 5.“运算符与运算对象类型不符”属于语义错误 6.算法逻辑上的错误属于语义错误第二章高级语言及其语法描述 1.程序语言是由语法和语义两方面定义的。 2.上下文无关文法的定义：四个组成部分：一组终结符号、一组非终结符号、一个开始符号、一组产生式。一个上下文无关文法G是一个四元式(VT,VN,S, P )，其中：VT:是非空有限集，它的每个元素是终结符号；VN是非空有限集，它的每个元素是非终结符号，VTA VN=O, VTU VN=V;S S€ VN称为开始符号；P :产生式集合(有限)，每个产生式形式是{ P-> a | P € VN a€ (VTU VN)*，S 至少一次为P }； 3.推导、最左推导、最右推导：1、推导：如两个串uO、un，存在一个串序列uO=>u仁>-=>un,则我们称这个序列是从u0到un 的一个推导。 —I- U1----- 、un：表示从u0出发，经一步或若干步，可推导出un. U1—；un：表示从u0出发，经0步或若干步，可推导出un. 最左推导是指，任何一步a =>B都是对a中的最左非终结符进行替换的。最右推导是指，任何一步a =>B都是对a中的最右非终结符进行替换的。 4.语法树：在编译中产生语法树是为了语法分析。 5.什么是句型？什么是句子？什么是语言？假定G是一个文法，S是它的开始符号。如果S=> a，则称a是一个句型。仅含终结符的句型是一个句子。文法G所产生的句子的全体是一个语言。语言是由句子组成的集合，是由一组记号所构成的集合。 6.乔姆斯基把文法分成4种类型，即0型文法、1型文法、2型文法和3型文法。0型文法也称为短语文法。1型文法也称为上下文有关文法。2型文法也称为上下文无关文法。3型文法也称为正规文法。与程序语言语法有关的文法是上下文无关文法。第三章词法分析 1.状态转换图：使用状态转换图是设计词法分析程序的一种好途径，状态转换图是一张有限方向图。在状态转换图中，结点代表状态，用圆圈表示。一个状态转换图可用于识别(或接受)一定的字符串。 2.确定的有限自动机(DFA、非确定有限自动机(NFA)。五元式：有限状态集合、有穷字母表、转换函数、唯一的初始状态、终止状态集合。一个确定有限自动机(DFA M是一个五元式：M = (S,刀,8 ,s0 ,F)，其中S是一个有限集，它的每个元素称为一个状态，二是一个有穷字母表，它的每个元素称为一个输入字符，3是一个从SXE至S的单值部分映射。8 (s,a)=s ' 意味着：当现行状态为、输入字符为a时，将转换到下一状态s 我们称s'为s的一个后继状s0€ S是唯一的初态F是一个终态集(可空)。一个非确定有限自动机(NFA M是一个五元式：M = (S, E, 8 ,S0 ,F)，其中S是一个有限集，它的每个元素称为一个状态，二是一个有穷字母表，它的每个元素称为一个输入字符，8是一个从SXE*至S的子集的映射，即8: SXE* -2s，S0€ S是唯一的初态，F是一个终态集(可空)。 3.设有确定的有限自动机DFA M = ({0,1,2,3},{a,b}, 8 ,0,{3})，其中8 为：8 (0,a)=1 8 (0,b)=2 8 (1,a)=3 8 (1,b)=2 8 (2,a)=1 8 (2,b)=3 8 (3,a)=3 8 (3,b)=3

编译原理词法分析和语法分析报告+代码(C语言版)

词法分析一、实验目的设计、编制并调试一个词法分析程序，加深对词法分析原理的理解。二、实验要求 2.1 待分析的简单的词法（1）关键字： begin if then while do end 所有的关键字都是小写。（2）运算符和界符： = + - * / < <= <> > >= = ; ( ) # （3）其他单词是标识符（ID）和整型常数（SUM），通过以下正规式定义： ID = letter (letter | digit)* NUM = digit digit* （4）空格有空白、制表符和换行符组成。空格一般用来分隔ID、SUM、运算符、界符和关键字，词法分析阶段通常被忽略。 2.2 各种单词符号对应的种别码：输入：所给文法的源程序字符串。输出：二元组（syn,token或sum）构成的序列。其中：syn为单词种别码； token为存放的单词自身字符串； sum为整型常数。例如：对源程序begin x:=9: if x>9 then x:=2*x+1/3; end #的源文件，经过词法分析后输出如下序列： (1,begin)(10,x)(18,:=)(11,9)(26,;)(2,if)…… 三、词法分析程序的算法思想：算法的基本任务是从字符串表示的源程序中识别出具有独立意义的单词符号，其基本思想是根据扫描到单词符号的第一个字符的种类，拼出相应的单词符号。

3.1 主程序示意图：主程序示意图如图3-1所示。其中初始包括以下两个方面： ⑴关键字表的初值。关键字作为特殊标识符处理，把它们预先安排在一张表格中（称为关键字表），当扫描程序识别出标识符时，查关键字表。如能查到匹配的单词，则该单词为关键字，否则为一般标识符。关键字表为一个字符串数组，其描述如下： Char *rwtab[6] = {“begin”, “if”, “then”, “while”, “do”, “end”,}; 图3-1 （2）程序中需要用到的主要变量为syn,token和sum 3.2 扫描子程序的算法思想：首先设置3个变量：①token用来存放构成单词符号的字符串；②sum用来整型单词；③syn用来存放单词符号的种别码。扫描子程序主要部分流程如图3-2所示。

电子科技大学《程序设计语言与编译》自测题答案

程序设计语言与编译一一、单项选择题（每题1分，共10分） 1.一个程序单元可有（ D ）实例。 A.0个， B.1个， C.2个， D.多个 2.编译程序是将（ C ）程序改造成目标语言程序的翻译程序。 A.机器语言， B.汇编语言， C.高级语言， D.低级语言 3.规范规约每次都是对（A ）进行规约。 A.句柄， B.短语， C.最左素短语， D.句型 4．LR分析法的核心部分是（B ）。 A.总控程序， B.分析表， C.分析栈， D.可规约串 5．现今多数语言的描述工具是上下文无关文法，它对应于（D ）。 A.图灵机， B.线性有界自动机， C.有限自动机， D.非确定的下推自动机 6．将一台实际的机器装上Pascal编译程序，它就成为Pascal( D )。 A.抽象机， B.识别机， C.翻译机， D.虚拟机 7．词法分析器的输入是（A ）。 A.字符串， B.二元式， C.三元式， D.四元式 8．在一棵语法树中，子树叶结点的自左至右排列称为（ A ）。 A．短语，B.句型，C.句柄，D.素短语 9．运行时进行的检查称为（B ）。 A．错误检查，B.动态检查，C.静态检查，D.随机检查 10．一个对象与其某种属性建立某种联系的过程，称为（ D ）。 A．赋值，B.存储，C.定义，D.绑定二、多项选择题（每小题2分，共10分） 1．类型转换的方法（B E ） A.动态转换， B.拓展， C.静态转换， D.收缩， E.显式转换 2．语句级控制结构有（BCE ） A.递归， B.顺序， C.选择， D.过程调用， E.重复 3．Chomsky 将文法分成（ACDE ） A．短语文法，B.LL(1)文法，C.上下文无关文法，D.上下文有关文法，E.正规文法 4．数据聚合的方式有（ABDE ） A.笛卡儿积， B.有限映像， C.指针， D.递归， E.判定或 5．强制性语言中，变量具有属性（ABDE ） A.作用域， B.生存期， C.强制性， D.值， E.类型三、简答题（每小题5分，共20分） 1、分程序与复合语句的区别是什么？分程序中可说明局部于该程序的变量，复合语句是可执行语句的序列，其中没有说明语句 2、循环优化有哪几种方法？代码外提，强度削弱，删除归纳变量 3、怎样判断一个文法具有二义性？文法G如果产生的某个句子对应两棵不同的语法数，则有二义性 4、什么叫语法制导翻译？每个产生式配一个子程序，在语法分析的过程中，每当用一个产生式进行匹配或归约时，就调用相应的语义子程序四、推导题（共15分） 1、已知文法G(S): S→a∣b∣(A) A→SdA∣S 1.证明（bdS）是G（S）的句型；（5分） S=>（A）=> (SdA)=>(bdA)=>(bdS) 所以是句型 2.画出（bdS）的推导树；（5分） S （ A ） S d A b S 3.求句型（bdS）的短语，直接短语，素短语，句柄。（5分）短语b、S、bdS、（bdS）直接短语b、S 素短语b 句柄 b 五、算符优先分析法（共15分）设有文法G：

程序设计语言编译原理_考试重点(终)

1 2 3 开 4 1 0 1 1 1 0 1 3 0 1 2 a a a ，a b b b 第一章引论 1.编译程序分几个阶段，每个阶段的任务是什么？五个阶段：词法分析、语法分析、语义分析、中间代码生成、优化、目标代码生成词法分析任务：输入源程序，对构成源程序的字符串进行扫描和分解，识别出一个个的单词。（如基本字，标识符，常数，算符和界符）。语法分析任务：在词法分析基础上，将单词符号串转化为语法单位（语法范畴）（短语、子句、句子、程序段、程序），并确定整个输入串是否构成语法上正确的程序。语义分析和中间代码生成任务：对语法分析所识别出的各类语法范畴，分析其含义，并进行初步翻译（产生中间代码）。代码优化任务：对于代码（主要是中间代码）进行加工变换，以期能够产生更为高效（省时间和空间）的目标代码。目标代码生成任务：将中间代码变换成特定机器上的低级语言代码 2.表格管理和出错处理：编译各阶段均须维持表格并进行表格管理，建表的技术支持是数据结构，表格的分类、结构、处理方法决定于语言及机器，还有优化措施。一个好的编译程序应该：全，最大限度发现错误；准，准确指出错误的性质和发生地点；局部化，将错误的影响限制在尽可能小的范围内。源程序中的错误通常分为：语法错误，不符合语法（或词法）规则的错误，如单词拼写错误、括号不匹配 ... 语义错误，不符合语义规则的错误，如说明错误、作用域错误、类型不匹配 ... 3.前端、后端：编译前端主要由与源语言有关，但与目标机无关的那些部分组成。编译后端包括编译程序中与目标机有关的那些部分。 4.遍：根据系统资源的状况、运行目标的要求……等，可以将一个编译程序设计成多遍扫描的形式，在每一遍扫描中，完成不同的任务。遍可以和阶段相对应，也可无关。单遍代码不太有效。遍是对源程序或源程序的中间结果从头到尾扫描一次，并作有关的加工处理，生成新的中间结果或目标程序。 5.“运算符与运算对象类型不符”属于语义错误 6.算法逻辑上的错误属于语义错误 7.编译程序：能够把某一种语言程序转换成另一种语言程序，而后者与前者在逻辑上是等价的一种程序。通常是从高级语言转换成为低级语言。 8.解释程序：它以该语言写的源程序作为输入，但是不产生目标代码，而是边解释边执行源程序本身。 9.诊断编译程序：专门用于帮助程序开发和调试的编译程序。 10.优化编译程序：着重于提高目标代码效率的编译程序。 11.宿主机：运行编译程序的计算机。 12.目标机：运行编译程序所产生目标代码的计算机。 13.交叉编译程序：一个程序产生不同于宿主机的机器代码的程序。 14.可变目标编译程序：如果不需要重新编译程序中与机器无关的部分就能改变目标机，则该编译程序就叫做可变目标编译程序。 PS ：世界上第一个编译程序——FORTRAN 编译程序——20世纪50年代 15.编译过程第一阶段：词法分析——词法分析器 1)任务：输入源程序，对构成源程序的字符串进行扫描和分解，识别出一个个的单词（亦称单词符号或简称符号），标示符，常熟，算符和界符。2）单词符号是语言的基本组成成分，是人们理解和编程的基本要素。3)描述词法规则的有效工具是：正规式和有限自动机第二阶段：语法分析——（词法）分析器 1)任务：在词法分析的基础上，根据语言的语法规则，把单词符号分解成各类语法单位，如“短语”、“子句”、“句子”、“程序段”和“程序”等。通过语法分析，确定整个输入串是否构成语法上正确的“程序”。2)语法分析所依据的是语言的语法规则。通常是上下文无关文法描述、3)词法分析是一种线性分析，而语法分析是一种层次结构分析。第三阶段：语义分析和中间代码产生——语义分析器 1)任务：对语法分析所识别出的各类语法范畴，分析其含义，并进行初步翻译（产生中间代码）。2)对每种语法范畴进行静态语义检查—>进行中间代码的翻译。3)语义分析所依据的是语言的语义规则，通常使用属性文法描述语义规则。4)中间代码：一种含义明确、便于处理的记号系统，它通常独立于具体的硬件。5)中间代码的四元式表示形式。此外还有三元式、间接三元式、逆波兰记号和树。第四阶段：优化——优化器 1)任务：在于前段产生的中间代码进行加工交换，，以期在最后阶段能产生更为高效（省时间和空间）的目标代码。2)优化的主要方面有：公共字表达式、优化循环、删除无用代码等等。3)优化所依据的原则：程序的等价变化原则。第五阶段：目标代码生成——目标代码生成器 1)任务：吧中间代码（或经优化处理后）变换成特定机器上的低级语言代码。2)形式：绝对指令代码或可重定位的指令代码或汇编指令代码。 16.编译程序的结构语法错误：指源程序中不符合语法（或词法）规则的错误，他们可在词法分析和语法分析时检测出来语法错误：指源程序中不符合语义规则的错误，一般在语义分析时检测出来，有的要在运行时才能检测出来。通常有：说明错误、作用域错误、类型不一致等遍：对源程序或源程序的中间结果从头到尾扫描一次，并作有关的加工处理，生成新的中间结果或目标程序。编译前段：由与源程序有关但与目标程序无关的那些部分组成。包括词法分析、语法分析、语义分析与中间代码和一些优化工作。编译后端：编译程序中与目标机有关的那些部分，后端不依赖于源语言而仅仅依赖于中间语言。集成化的程序设计环境的特点：它将相互独立的程序设计工具集成起来，以使为程序员提供完整的、一体化的支持，从而进一步提高程序开放效率，改善程序质量。 17.T 形图第二章高级语言及其语法描述 1. 程序语言是由语法和语义两方面定义的。 2.上下文无关文法的定义：四个组成部分：一组终结符号、一组非终结符号、一个开始符号、一组产生式。一个上下文无关文法G 是一个四元式（VT,VN,S, P ），其中: VT ：是非空有限集，它的每个元素是终结符号；VN ：是非空有限集，它的每个元素是非终结符号， VT ∩VN=Φ，VT ∪VN=V;S ：S ∈VN ，称为开始符号；P ：产生式集合（有限），每个产生式形式是{ P->α| P ∈VN ， α∈(VT ∪VN)*，S 至少一次为P }； 3.推导、最左推导、最右推导：1、推导：如两个串u0、un ，存在一个串序列u0=>u1=>…=>un ，则我们称这个序列是从u0到un 的一个推导。 U1un ：表示从u0出发，经一步或若干步，可推导出un. U1 un ：表示从u0出发，经0步或若干步，可推导出un. 最左推导是指，任何一步α=>β都是对α中的最左非终结符进行替换的。最右推导是指，任何一步α=>β都是对α中的最右非终结符进行替换的。 4.语法树：在编译中产生语法树是为了语法分析。 5、什么是句型？什么是句子？什么是语言？假定G 是一个文法，S 是它的开始符号。如果S=> α，则称α是一个句型。仅含终结符的句型是一个句子。文法G 所产生的句子的全体是一个语言。语言是由句子组成的集合，是由一组记号所构成的集合。 6.乔姆斯基把文法分成4种类型，即0型文法、1型文法、2型文法和3型文法。0型文法也称为短语文法。1型文法也称为上下文有关文法。2型文法也称为上下文无关文法。3型文法也称为正规文法。与程序语言语法有关的文法是上下文无关文法。第三章词法分析 1.状态转换图：使用状态转换图是设计词法分析程序的一种好途径，状态转换图是一张有限方向图。在状态转换图中，结点代表状态，用圆圈表示。一个状态转换图可用于识别（或接受）一定的字符串。 2.确定的有限自动机（DFA ）、非确定有限自动机（NFA ）。五元式：有限状态集合、有穷字母表、转换函数、唯一的初始状态、终止状态集合。一个确定有限自动机（DFA ） M 是一个五元式：M ＝ (S,∑,δ,s0 ,F) ，其中S 是一个有限集，它的每个元素称为一个状态，∑是一个有穷字母表，它的每个元素称为一个输入字符，δ是一个从S ×∑至S 的单值部分映射。 δ(s,a)=s ′意味着：当现行状态为、输入字符为a 时，将转换到下一状态s ′。我们称s ′为s 的一个后继状s0∈S 是唯一的初态F 是一个终态集（可空）。一个非确定有限自动机（NFA ） M 是一个五元式：M ＝ (S,∑,δ,S0 ,F) ，其中S 是一个有限集，它的每个元素称为一个状态，∑是一个有穷字母表，它的每个元素称为一个输入字符，δ是一个从S ×∑*至S 的子集的映射，即δ： S ×∑* → 2s ，S0∈S 是唯一的初态，F 是一个终态集（可空）。 3.设有确定的有限自动机DFA M = ({0,1,2,3},{a,b},δ,0,{3})，其中δ为:δ(0,a)=1 δ(0,b)=2 δ(1,a)=3 δ(1,b)=2 δ(2,a)=1 δ(2,b)=3 δ(3,a)=3 δ(3,b)=3 请画出状态转换矩阵和状态转化图。相应的状态转换矩阵如下表：对应的状态转换图 4.设计一个DFA,要求能够识别∑={0,1}上能被5整除的二进制数。 5.词法分析的流程第四章语法分析——自上而下分析 1.语法分析器的功能：识别语法成分,并作语法检查. 2.自上而下语法分析方法遇到的主要问题是回溯和左递归。 3.把一个文法改造成任何非终结符的所有候选式首符集两两不相交的方法是提取公共左因子。 4.LL （1）分析法中，第一个L 表示从左到右扫描输入串，第二个L 表示最左推导。1表示分析时每步只需向前看一个符号。 5.LL （1）文法的条件：1文法不含左递归2）FIRST(α)∩ FIRST(β) = φ3）算符左操作数右操作数结果状态 a b 0 1 2 1 3 2 2 1 3 3 3 3

编译原理第一章练习和答案

例1设有文法G[S]: S →a|（T ）| T →T,S|S （1）试给出句子(a,a,a)的最左推导。（2）试给出句子(a,a,a)的分析树（3）试给出句子(a,a,a)的最右推导和最右推导的逆过程(即最左规约)的每一步的句柄。【解】(1) (a,a,a)的最左推导 S=>(T) =>(T,S) =>( T,S,S) =>( S,S,S) =>(a,S,S) =>(a,a,S) =>(a,a,a) （2）(a,a,a)的分析树 S ( T ) T ， S S T ， S a a (3) (a,a,a)最右推导最左规约每一步的句柄 S=>(T) 句柄为：(T) =>(T,S) 句柄为：T,S =>(T,a) 句柄为：a =>(T,S,a) 句柄为：T,S =>(T,a,a) 句柄为：第一个a =>(S,a,a) 句柄为：S =>(a,a,a) 句柄为：第一个a 例2已知文法G[Z]: Z →0U|1V U →1Z|1 V →0Z|0 （1）请写出此文法描述的只含有４个符号的全部句子。（2） G [Z]产生的语言是什么？（3）该文法在Chomsky 文法分类中属于几型文法？【解】（1）0101，0110，1010， 1001 （2）分析G[Z]所推导出的句子的特点：由Z 开始的推导不外乎图1所示的四种情形。图 1文法G[Z]可能的几种推导 Z 1 U Z U Z 1 Z 1 Z 1 V 由Z 推导出10或01后就终止或进入递归，而Z 的每次递归将推导出相同的符号串：10或

01。所以G[Z]产生的语言L(G[Z])={x|x∈(10|01)+ } (3)该文法属于3型文法。例3 已知文法G=({A,B,C}，{a,b,c}，P，A), P由以下产生式组成: A→abc A→aBbc Bb→bB Bc→Cbcc bC→Cb aC→aaB aC→aa 此文法所表示的语言是什么？【解】分析文法的规则：每使用一次Bc→Cbcc，b、c的个数各增加一个；每使用一次aC→aaB或aC→aa, a的个数就增加一个；产生式Bb→bB、 bC→Cb起连接转换作用。由于A是开始符号，由产生式A→abc推导得到终结符号串abc；由产生式A→aBbc推导得到B后，每当使用产生式Bb→bB、Bc→Cbcc、bC→Cb、aC→aaB就会递归调用B一次，所产生的a、b、c的个数分别增加一个，因此推导所得的终结符号串为abc、aabbcc、aaabbbccc、…所以文法描述的语言为{ a n b n c n|n>0}. 例4 构造描述语言L(G[S])={（n）n|n≥0} 的文法。【解】(1)找出语言的一些典型句子: n=0 ε n=1 ( ) n=2 (()) … 所以, L(G[S])={ ε、( ) (())、((()))、…} (2)分析句子的特点: 只含有(和),(和)的个数相同且对称, 句子中所含的符号数可无限, 句子的个数可无限。 (3)凑规则:由 S→ε|() 得到ε|()，由 A→ (S) 得到 (())，(()) 是在（）的两边再加上一对（）得到，((()))是在(())的两边再加上一对（）得到，…所以将上述产生式合并为S→(S) |ε。 (4)得到文法 G[S]: S→(S) |ε (5)检验:语言所有的句子均可由文法G[S]推导出来, 文法G[S]推导出来的所有终结符号串均为语言的句子. 例5 构造描述语言L(G[S])={a m b n |n>m>0} 的文法。【解】找出语言的一些典型句子:abb、abbb、…、aabbb、aabbbb、…,语言的句子的特点是仅含有a、b, a在b的左边，b的个数大于a的个数，a的个数至少是1。单独生成c k, k>1 可用产生式 C→c |Cc 句子中要求b的个数大于a的个数，所以得到文法：