资讯专栏INFORMATION COLUMN

C语言进阶:程序预处理

gxyz / 1827人阅读

摘要:程序预处理本章节研究的是,源代码文件是如何一步步得到一个可执行程序的。如的语句被称为预处理指令,还有注释文本的删除,都在此阶段完成替换。目的是能够将所有文件中的代码组合到一起成一个完整的程序。终止程序可以正常也可以意外终止程序。

程序预处理

本章节研究的是,源代码文件test.c是如何一步步得到一个可执行程序test.exe的。在之前的学习中可知.c文件要先后经过编译链接成.exe文件再执行。

程序的编译链接运行如下图所示。翻译中编译又包括预编译、编译、汇编。

编译链接执行三个步骤,都需要为其配置不同的环境。编译和链接在翻译环境中,而执行在运行环境中发生。

  • 翻译环境:在该环境中源代码被转换成可执行的机器指令。
  • 执行环境:用于实际执行代码。

程序的翻译环境

翻译阶段的大致流程如下图所示。

组成一个程序的每个.c源文件都会被编译器编译,分别生成对应的.obj目标文件。多个目标文件以及引入的链接库被链接器链接在一起,形成一个单一的.exe可执行程序。

编译器即是一个用于编译代码的工具,在vs环境下为cl.exe的可执行程序。连接器则是用于链接所有目标文件的工具,在vs中为link.exe的可执行程序,链接库是标准中任何被该程序用到的函数。如图:

而若想观察翻译代码过程中的每一个流程的具体细节,在集成开发环境vs中不便展示,当然我们可以使用Linux环境下的gcc编译器。

此次演示就采用加法函数,分别存放在两个文件test.cadd.c

//1. add.cint Add(int x, int y){	int sum = x + y;	return sum;}//2. test.c#include  //声明函数extern int Add(int x, int y);int main(){	int a = 10;	int b = 20;	int ret = 0;	ret = Add(a, b);	printf("ret = %d/n", ret);	return 0;}
预编译

Linux环境下编写完test.c文件的代码后,输入gcc test.c -E可以将代码预编译的结果输出到屏幕上。还可以用gcc test.c -E -o test.i是将结果输出到文件test.i

#include,#define,#pragma的语句被称为预处理指令,还有注释文本的删除,都在此阶段完成替换。

所有可以看出预编译阶段的动作都是文本操作

  1. #include头文件的包含
  2. #define预处理符号的替换
  3. 删除注释

预编译,顾名思义,是在编译前删减代码中的不必要的与机器识别代码无关的内容。被称为文本操作

编译

对预编译产生的文件test.i再编译gcc test.i -S,会自动生成汇编代码test.s

故编译阶段是将C语言代码转化为汇编代码,这是整体现象。实际上会发生这四个动作:

  1. 词法分析,语法分析,语义分析

词法分析,语法分析,语义分析都是编译器识别语句的操作。重点是接下接下来的符号汇总。

  1. 符号汇总

符号汇总,是只对全局符号进行汇总,局部符号是不进行汇总的。目的是能够将所有文件中的代码组合到一起成一个完整的程序。如add.c文件中的函数名Add,还有test.c文件中的Addmain

汇编

gcc test.s -C将编译结束产生的汇编代码转化成了二进制指令(机器指令)存入二进制文件test.o中。

汇编阶段会形成符号表,因为机器在调用指令时需要知道其存放的位置,所谓符号表大概就是符号和其地址的集合。如图,可以假设:

链接

链接将二进制指令目标文件test.o等,链接在一起形成可执行程序test.out。目标文件test.oelf格式文件,在Linux平台下可以用readelf翻译并查看其内容。

链接阶段的动作是:

  1. 合并段表

所谓的链接,就是将对应的段合并起来。

  1. 符号表的合并和重定位

符号表的合并,是将各自的符号表合并到一起。如test.o中的Add的无效地址,需把add.oAdd的地址合并过去再重定位到变量的真实地址,才是有意义的。

从编译期间的符号汇总,到汇编时的形成符号表,再到链接时的合并和重定位符号表,都是为了最后生成可执行程序时能够找到并链接各个文件中的符号。

程序的执行环境

  1. 程序首先载入内存

    有的机器上有操作系统,这个动作就是由操作系统完成,没有的由手工完成。

  2. 执行调用main函数

  3. 创建函数栈帧

    程序使用一个运行时堆栈,存储函数的局部变量和返回地址。

  4. 终止程序

    可以正常也可以意外终止程序。

程序的执行并不是本章的要点,所以就大概介绍一下。

文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。

转载请注明本文地址:https://www.ucloud.cn/yun/122008.html

相关文章

  • 只看不敲,神也学不好C---------计算机经典书籍经验分享

    摘要:学单片机多去官网上查资料,下载手册,像我入门的单片机经常去官网,还有学的系列板子,公司的官网的官方例程给的很详细,在英文视角阅读对你大有益处。 目录 1.C语言经典 2.单片机系列 3.Python方面 4.嵌入式LWip协议 5.Android 6.C++经典书籍 7.Linux开发 ...

    FleyX 评论0 收藏0
  • C语言进阶第一问:数据在内存中是如何存储的?(手把手带你深度剖析数据在内卒中的存储,超全解析,码住不

    摘要:在符号位中,表示正,表示负。我们知道对于整型来说,内存中存放的是该数的补码。在计算机系统中,数值一律用补码来表示和存储。表示有效数字,。规定对于位的浮点数,最高的位是 ...

    ghnor 评论0 收藏0
  • C语言进阶程序处理

    摘要:如的语句被称为预处理指令,还有注释文本的删除,都在此阶段完成替换。故宏在程序规模和执行速度方面更胜一筹。宏替换发生在预编译期间,故无法调试。宏可能由于运算符优先级的问题,会导致程序出错。 ...

    binta 评论0 收藏0
  • C语言进阶】☀️数据类型&&整型在内存中的存储

    目录 ​  一、数据类型介绍 二、类型的意义 三、类型的基本归类 整型家族 浮点数家族 构造类型(自定义类型) 指针类型 空类型 四、整形在内存中的存储 原码、反码、补码 大小端字节序 为什么有大端和小端? 一道经典笔试题  一、数据类型介绍 数据从大的方向分为两类: 内置类型自定义类型内置类型我们前面已经学习过,如下: char            //字符数据类型 short      ...

    Xufc 评论0 收藏0

发表评论

0条评论

最新活动
阅读需要支付1元查看
<