C语言系列01-解析C语言编译、链接和运行源文件

用C编写的程序被存储在文本文件中，该文件就被称之为源文件(source code file)。比如如下的代码

#include int main() { printf("hello world"); getchar();return 1;}

源码编译

计算机CPU的母语是机器语言，用C语言编写的代码CPU不能识别运行。这就好比中国人的母语是汉语，而美国人的母语是英语。中国人使用汉语和美国人交流，美国人听不懂，反过来也是一样的。我们要和对方进行交流，就需要有个中间人做翻译，将汉语翻译成英语和美国人进行交流。

同样的道理，我们和CPU交流，让CPU给我们干活执行任务，需要用CPU能听懂的语言和其交流。所以呢C语言在运行之前首选需要进行编译。编译就像是一个翻译，将C语言翻译成CPU能听懂的机器语言。编译就是把C语言转换为机器语言。类似于翻译

使用gcc编译器将hello.c 编译成二进制文件hello.obj

gcc -c hello.c -o hello.obj

编译后的文件如下图所示：

编译后生成的hello.obj文件，目前还是不能运行的。因为目前只是把我们上边的源代码编译成了二进制文件。我们的源代码并不是完整的可执行文件。

首先，我们源文件中调用了库函数中的printf，我们的源代码中并没有这个函数的源代码，printf函数的代码存放在库文件中。

其次，我们的源文件中还缺少启动代码。启动代码充当程序和操作系统的接口。

所以编译生成的obj文件，我们称之为中间文件。中间文件需要运行，就需要把程序用到的所有代码都包含进来，这个过程就叫做链接。

链接

链接的作用就是把源文件，系统标准的启动代码，程序中用到的库函数代码这三部分合并成一个文件，该文件就是可执行文件。连接器只会把程序中用到的库函数的代码包含进来。

我们将上边编译生成的文件进行链接：

gcc hello.obj -o hello

链接之后如下图所示：

可以看到链接之后的可执行文件文件大小53kb,明显比我们的源文件，和中间文件大了很多，这时候的可执行文件，鼠标双击即可执行。

链接又可以分成静态链接和动态链接这两种

静态链接

假如有程序A和B，在运行时候都会用到函数MyFunc，那么在程序链接的时候各自拷贝了一份函数MyFunc的代码到各自可执行文件中，程序A、B并行运行过程中，内存中存储了两份函数Myfunc的代码，这种链接方式就是静态链接

动态链接（Dynamic Link Library）

假如将MyFunc做成一个DLL文件，在程序A、B运行的过程中在去动态的链接该文件，就称之为动态链接文件

程序的可移植性

机器语言

不同的CPU硬件平台的指令集不同的，在没有高级语言的时代，人们直接使用机器指令来编程。比如使用x86平台的机器指令集进行编程，那机器指令就只能在x86平台运行。在其他的CPU平台比如MIPS，ARM等上边运行不了的，同样的MIPS的机器指令集在x86平台也是运行不了的

汇编语言

由于直接使用机器指令集，对人类来说，不太友好。人们后面就开始使用助记符来代替机器指令，在运行的时候由汇编器编译成机器指令运行。但是呢，助记符和机器指令是一一对应的，仍然不具有可移植性

高级语言

现代的高级语言比如C，运行的时候需要由编译器进行编译的。对于程序员来说，可以不用关注底层的机器指令，只需要熟悉高级语言相应的语法就可以了。按照C语言的语法写的代码，不用做大的改动就可以在多个平台运行。比如要在X86平台运行，那x86平台的C编译器会将C语言编译成x86平台的机器指令，在MIPS平台运行，那么MIPS平台的C编译器会将c代码编译为MIPS平台的机器指令。

C语言系列01-解析C语言编译、链接和运行源文件

源码编译

链接

程序的可移植性

最新关注

热文推荐

LInux系统架构—-Nginx的深入优化

C++面试八股文：什么是智能指针？

IEEE RAS 技术委员会 – Technical Committees

华为OD机试 – 模拟目录管理功能（Java & JS & Python & C）

如何应对人工智能时代下的网络与数据安全威胁

H5页面跳转小程序的三种方式

C语言系列01-解析C语言编译、链接和运行源文件

源码编译

链接

程序的可移植性

相关文章

最新关注

热文推荐