编译原理 第1章:概述
文章目录
- 1. 什么叫编译程序
- 2. 编译过程及编译程序构造
- 2.1 词法分析
- 2.2 语法分析
- 2.3 语义分析和中间代码的产生
- 2.4 优化
- 2.5 目标代码产生
- 2.6 编译程序的逻辑结构
- 2.7 遍(PASS)
- 2.8 前端和后端
- 3. 编译程序的生成
- 3.1 第一种情况:同一台机器,不同的语言
- 3.2 第二种情况:同一种语言,不同的机器
- 3.3 第三种方案:自展
1. 什么叫编译程序
-
源程序:用汇编语言或高级语言编写的程序称为源程序(无法直接执行)。
-
目标程序:用目标语言所表示的程序。可以是
- 介于源语言和机器语言之间的某种“中间语言”
- 某种机器的机器语言
- 某种机器的汇编语言 -
翻译程序:将某一种语言程序(称为源语言程序)等价地转换为另一种语言程序(称为目标语言程序)的程序称为翻译程序。它是指各种语言的翻译器,是汇编程序、编译程序以及各种变换程序的总称。
-
源程序、翻译程序、目标程序三者关系:
-
汇编程序
若源程序用汇编语言书写,经过翻译程序得到用机器语言表示的程序,这时的翻译程序就称之为汇编程序,这种翻译过程称为“汇编”(Assemble) -
编译程序
若源程序是用高级语言书写,经加工后得到汇编语言或机器语言这样的目标程序,这种翻译过程称“编译”(Compile)(把某一种高级语言程序等价地转换成另一种低级语言程序(如汇编语言或机器语言程序)的程序)
汇编程序与编译程序都是翻译程序,主要区别是加工对象的不同。由于汇编语言格式简单,常与机器语言之间有一一对应的关系,汇编程序所要做的翻译工作比编译程序简单得多。
- 解释程序(interpreter)
把源语言写的源程序作为输入,但不产生目标程序,而是边解释边执行源程序本身
2. 编译过程及编译程序构造
总体框架:
2.1 词法分析
- 任务: 输入源程序,对构成源程序的字符串进行扫描和分解,识别出一个个单词符号,并以某种编码形式输出。
- 依循的原则:词法规则(构词规则)
- 描述工具:正规式与有限自动机
2.2 语法分析
- 任务:在词法分析的基础上,根据语言的语法规则(即语言的文法),分析并识别出各种语法成分,如表达式、各种说明、各种语句、过程、函数等,并进行语法正确性检查。
- 依循的原则:语法规则
- 描述工具:上下文无关文法
2.3 语义分析和中间代码的产生
-
任务
- 对各类不同语法范畴按语言的语义进行初步翻译,对识别出的各种语法成分进行语义分析,并产生相应的中间代码。
- 中间代码:一种介于源语言和目标语言之间的中间语言形式,中间代码的形式编译程序设计者可以自己设计,常用的有四元式、三元式、逆波兰表示、树形结构等 -
依循的原则:语义规则(属性文法)
2.4 优化
- 任务:对于前一阶段产生的中间代码进行加工变换(等价、高效、合算),以期在最后阶段产生更高效的目标代码。
2 . 依循的原则:程序的等价变换规则
2.5 目标代码产生
- 任务: 把中间代码变换成特定机器上的目标代码。
- 依赖于硬件系统结构和机器指令的含义
- 目标代码三种形式:
- 绝对指令代码: 可直接运行
- 可重新定位指令代码: 需要连接装配
- 汇编指令代码: 需要进行汇编
- 由中间代码很容易生成目标程序(地址指令序列)。这部分工作与机器关系密切 ,所以要根据机器进行。在做这部分工作时(要注意充分利用累加器),也可以进行优化处理。
2.6 编译程序的逻辑结构
2.7 遍(PASS)
遍:对源程序(包括源程序中间形式)从头到尾扫描一次,并做有关的加工处理 ,生成新的源程序中间形式或目标程序,通常称之为一遍
一遍扫描即可完成整个编译工作的称为一遍扫描编译程序,其结构为:
2.8 前端和后端
根据编译程序各部分功能,将编译程序分成前端和后端。
3. 编译程序的生成
3.1 第一种情况:同一台机器,不同的语言
3.2 第二种情况:同一种语言,不同的机器
3.3 第三种方案:自展