了解程序环境和预处理

  • 前言:
  • 一、程序环境
  • 二、编译+链接
    • 2.1 翻译环境
    • 2.2 编译的几个阶段
    • 2.3 运行环境
  • 三、预处理
    • 3.1 预定义符号
    • 3.2. #define的使用
      • 3.2.1 #define 定义标识符
      • 3.2.2 #define 定义宏
      • 3.2.3 #define 替换规则
      • 3.2.4 #和##的用途
      • 3.2.5 带副作用的宏参数
      • 3.2.6 宏和函数的对比
      • 3.2.7 命名约定
    • 3.3 #undef 的作用
    • 3.4 命令行定义
    • 3.5 条件编译
    • 3.6 文件包含
      • 3.6.1 头文件被包含的方式
      • 3.6.2 嵌套文件包含
  • 四、其他预处理指令

前言:

先简单了解一下程序环境,然后详细总结翻译环境里的编译和链接,然后在总结编译预处理。

一、程序环境

ANSI C的任何一种实现中,存在两个不同的环境

  1. 翻译环境:这个环境中源代码被转换为可执行的机器指令。
  2. 执行环境:执行二进制代码。

计算机如何执行二进制指令?

  • 我们写的C语言代码是文本信息,计算机不能直接理解。
  • 翻译环境: C语言代码——>二进制代码。(预编译、编译、汇编、链接)
  • 执行环境:执行二进制代码。

二、编译+链接

2.1 翻译环境

程序编译+链接过程:

  • 组成一个程序的每个源文件通过编译过程分别转换成目标代码(object code)。
  • 每个目标文件由链接器(linker)捆绑在一起,形成一个单一而完整的可执行程序
  • 链接器同时也会引入标准C函数库(ANSI C)中任何被该程序所用到的函数,而且它可以搜索程序员个人的程序库,将其需要的函数也链接到程序中。(链接库)
    注意:
    VS2019开发环境集成了:
    编译器( cl.exe )+链接器( link.exe )+调试器

2.2 编译的几个阶段

创建两个源文件:
sum.c

int sum(int num1,int num2){return num1+num2;}

test.c

#include extern int sum(int,int);//声明外部函数int main(){int n=sum(1,2;printf("%d\n",n);return 0}

VS2019这样的集成开发环境不方便观察编译细节,这里我使用Linux系统,gcc编译器观察这些细节。
编译分为两个阶段,编译+链接,其中编译可细分为预编译+编译+汇编。(隔离编译,一起链接)
为了查看编译期间的每一步发生了什么,我们可以用命令去编译程序,生成不同文件。
1.预处理

gcc -E test.c -o test.i
预处理完成后就停下来,预处理之后产生的结果都放在test.i文件中。

2.编译

gcc -s test.c(gcc -s test.i)
编译完成后就停下来,结果保存在test.s中。

3.汇编

gcc -c test.c(gcc -c test.s )
汇编完成后就停下来,结果保存在test.o中。

4.链接

gcc test.o -o test.
链接完成后就停下来,生成test.exe可执行程序。

具体流程如图所示:

2.3 运行环境

程序执行的过程:
1.程序必须载入内存中,在有操作系统的环境中: 一般这个由操作系统完成。在独立的环境中,程序的载入必须由手工安排,也可以是通过可执行代码置入只读内存来完成。
2.程序的执行便开始。接着便调用main函数
3开始执行程序代码。这个时候程序将使用一个运行时堆栈(stack)(也叫函数栈帧)存储函数的局部变量和返回地址。程序同时也可以使用静态(static) 内存,存储于静态内存中的变量在程序的整个执行过程中一直保留他们的值。
4.终止程序正常终止main函数也有可能是意外终止

三、预处理

3.1 预定义符号

__FILE__//进行编译的源文件__LINE__//文件当前的行号__DATE__//文件被编译的日期__TIME__//文件被编译的时间__STDC__//如果编译器遵循 ANSI C,其值为1,否则未定义(当前VS是不支持ANSI C(标准c))。

这些预定义符号都是语言内置的。
如图:

3.2. #define的使用

3.2.1 #define 定义标识符

语法:

define name stuff

例子:

#define MAX 1000//给1000定义一个标识符#define REG register //为register这个关键字,创建一个简短的名字#define DO_FOREVER for(;;)//用更形象的符号来替换一种实现#define CASE break;case//在写case的时候,自动把break加上#define DEBUG_PRINT printf("file:%s\tline:%d\tdatE:%s\ttime:%s\n",__FILE__,\__LINE__,__DATE__,__TIME__);//如果定义的标识符过长,可以分成几行写,除了最后一行外,每行的后面都加一个‘\’反斜杠,代表连续符

3.2.2 #define 定义宏

#define机制包括了一个规定,允许把参数替换到文本中,这种实现通常称为宏(macro)或者定义宏(define macro)。
#define 宏名{形参表) 字符串
其中形参表是个由逗号隔开的符号表,它可以出现在字符串中
注意:
参数列表的左括号必须与宏名紧领。
如果两者之间有任何空白存在,参数列表就会被解释为字符串的一部分。
举个例子:
定义一个宏

#define SQUARE(s) s*s

观察下面代码

int a=5;
printf(“%d\n”,SQUARE(a+1));
乍一看,你可能觉得这段代码将打印36这个值,实际上,它打印11
因为,宏,在预编译的时候,替换了文本,参数s被替换成a+1,所以这条语句实际是就变成了
printf(“%d\n”,a+1*a+1);

可以看到替换产生的表达式并没有按照预想的次序进行求值,在宏定义上加两个括号,这个问题就解决了。

#define SQUARE(s) (s)*(s)

结果:

printf(“%d\n”,(a+1) (*a+1));

提示:
所以用于对数值表达式进行求值的宏定义都应该用这种方式加上括号,避免在使用宏时由于参数中的操作符或相邻操作符之间不可预料的相互作用。

3.2.3 #define 替换规则

在程序中扩展#define定义符号和宏时,需要涉及几个步骤:
1.在调用宏时,首先对参数进行检查,看看是否包含任何由#definee定义的符号。如果有,它们首先被替换。
2.替换文本随后被插入到程序中原来文本的位置。对于宏,参数名被他们的值所替换。
3.最后,再次对结果文件进行扫描,看看它是否包含任何由#define定义的符号。如果是,就重复上述处理过程。
注意:
1.宏参数和#define定义中可以出现其他#define定义的符号。但是对于宏,不能出现递归。
2.当预处理器搜索#define定义的符号的时候字符串常量的内容并不被搜索。

3.2.4 #和##的用途

“#”的用途:

观察这个函数和这个结果,我们发现字符串有自动连接的特点。

观察这个函数和这个结果,我们发现当字符串作为宏参数的时候才可以把字符串放在字符串中

观察这个函数和这个结果,我们发现使用#,把一个宏参数变成对应的字符串
代码中#value会被预处理器处理为“value”

“##”的用途:
可以把位于它两边的符号合成一个符号。
它允许宏定义从分离的文本片段创建标识符。


观察这两个函数和结果,我们发现宏定义时,”##”连接必须产生一个合法的标识符,否则其结果就是未定义。

3.2.5 带副作用的宏参数

当宏参数在宏的定义中出现超过一次的时候,如果参数带有副作用,那么你在使用这个宏的时候就可能出现危险,导致不可预测的后果。副作用就是表达式求值的时候出现的永久性效果
例子:

#include #define MAX(a,b) ((a)>(b)" />(a):(b))int main(){int x = 5;int y = 8;int z = MAX(x++, y++);printf("x=%d\ty=%d\tz=%d\n", x, y, z);return 0;}

打印结果:

这里的MAX宏具有副作用,参数在定义中使用了多次

处理器处理之后的结果:
z=((x++)>(y++)” />3.2.6 宏和函数的对比

宏通常可以执行简单的运算。
比如在两个数中找出较大的一个。

#define MAX(a, b) ((a)>(b)?(a):(b))

这里,我们为什么不用函数来完成这个任务?
宏的优点
1.用于调用函数从函数返回的代码可能比实际执行这个小型计算工作所需要的时间更多。所以宏比函数在程序的规模和速度方面更胜一筹。
2.更为重要的是函数的参数必须声明为特定的类型
所以函数只能在类型合适的表达式上使用。反之可以适用于整形、长整型、浮点型等可以用来比较的类型。
宏是类型无关的。
宏的缺点
当然和函数相比宏也有劣势的地方:
1.每次使用宏的时候,一份宏定义的代码将插入到程序中。如果宏较长,可能大幅度增加程序的长度
2.宏是不能调试的。
3.由于与类型无关,也就不够严谨。
4.宏可能会带来运算待优先级的问题,导致程序容易出错。

举个例子:宏可以做到函数做不到的事情,宏的参数可以是类型,函数做不到。

#define MALLOC(num,type) (type*)malloc(num*sizeof(type));//使用MALLOC(20, int);//类型做参数//经过预处理器替换后(int*)malloc(10 * sizeof(int));

宏和函数的对比:

补充:
函数栈帧:

  1. 调用函数
  2. 创建函数栈帧
  3. 进行计算
  4. 返回函数

inline(内联函数):
即有宏的优点,也有函数的优点。(没有调用函数返回函数这两个过程)

3.2.7 命名约定

函数和宏的使用语法相似,所以语言本身没有办法区分二者。
程序员默认:
宏名全部大写
函数名不要全部大写

3.3 #undef 的作用

#undef的作用就是移除一个宏定义
如果现存的名字要重新定义,那么它的旧名字首先要被移除

#include #define MAX 10int main(){printf("%d\n", MAX);#undef MAX#define MAX 20printf("%d\n", MAX);return 0;}

打印结果:

3.4 命令行定义

许多C的编译器提供了一种能力,允许在命令行中定义符号。用于启动编译过程。
例如:当我们根据同一个源文件要编译出一个程序的不同版本的时候,这个特性有点用处。(假定某个程序中声明了一个某个长度的数组,如果机器内存有限,我们需要一个很小的数组, 但是另外一个机器内存大些,我们需要一个数组能够大些。 )

VS环境无法演示,可以用gcc编译器来演示

#include int main(){int arr[arr1];int i =0 ;for(i = 0; i < arr1; i++){arr[i] = i;}for( i = 0; i < arr1; i++){printf("%d ",arr[i]);}printf("\n");return 0;}

  1. ls 调出当前文件夹的菜单
  2. gcc test.c -D arr1=15 -o test -D指定变量给它赋值 -o编译test.c文件(用gcc编译器编译test.c文件并指定arr1的值为15)(gcc -D arr1=10 test.c)
  3. ./test .当前目录 /test文件(编译当前目录底下的文件)

3.5 条件编译

条件编译的目的和作用:
1.条件编译是指对源程序中某段程序通过条件来控制是否参加编译。
2.根据条件来选取需要的代码进行编译,以便生成不同的应用程序,供不同的用户使用(不同的软硬件平台)。
3.条件编译还可以方便程序的逐段调试,简化调试过程。

在编译一个程序的时候我们如果要将一条语句(一组语句) 编译或者放弃是很方便的。因为我们有条件编译指令。
比如说:
调试性的代码,删除可惜,保留又碍事,所以我们可以选择性的编译。

#include //#define __DEBUG__int main(){int i = 0;int arr[10] = { 0 };for (i = 0; i < 10; i++){arr[i] = i;#ifdef __DEBUG__printf("%d\n", arr[i]);#endif}for (i = 0; i < 10; i++){printf("%d ", arr[i]);}return 0;}


常见的条件编译指令:

1、条件编译

#if 常量表达式
//…………
#endif
//常量表达式由预处理器求值
如:
#define DEBUG 1
#if DEBUG//成立
//…………执行
#endif //结束标志
功能:如果常量表达式的结果为真(非0),那么就会执行编译。

2.多分支条件编译

#if 常量表达式1
程序段1//……
#elif 常量表达式2
程序段2//……
#else
程序段3//……
#endif
功能:
如果表达式1的值为真(非0),对程序段1进行编译,如果表达式2的值为真(非0),对程序段2进行编译,否则就编译程序段3,可以使程序在不同的条件下,完成不同的功能。

3.判断是否被定义
//symbol是符号的意思,定义了符号就执行程序段

1、
#if defined(symbol)
程序段
#endif
2、
#ifdef(symbol)
程序段
#endif
3、
#if !defined(symbol)
程序段
#endif
4、
#ifndef(symbol)
程序段
#endif//结束标志
功能:
如果标识符已被#define定义过,则对程序段进行编译。

4、嵌套指令

#if defined(os_UNIX)
#ifdef OPTION1
Unix_option();
#endif
#ifdef OPTION2
Unix_option2();
#endif
#elif defined(os_MISDOS)
#ifdef OPTION2
Misdos_option2();
#endif
#endif
嵌套问题注意配对endif

例子:

#include #define MAX 100#define MIN 1int main(){#if defined(MAX)#ifdef MAXprintf("1\n");#endif#ifdef MINprintf("2\n");#endif#elif defined(MIN)#ifdef OPTION2printf("3\n");#endif#endifreturn 0;}

打印结果:

注意:
1.条件编译实现的逻辑可以用条件语句来实现,但是条件语句会对整个源程序进行编译,生成的目标代码程序较长,运行时间也较长。
2.采用条件编译可以根据条件只编译程序段1或者程序段2,生成的目标程序较短,运行时间也较短。

3.6 文件包含

#include指令可以使另外一个元素被编译,它的用途是,在#include指令的地方把包含的文件全部替换。(预处理时,先删除这条指令,然后把包含文件的内容全部替换)

3.6.1 头文件被包含的方式

  • 本地文件包含:

#include “myfile”

查找策略:先在源文件目录下查找,如果头文件未找到,编译器就会像库函数头文件一样,在标准路径位置查找头文件;如果找不到就提示编译错误。

  • 库文件包含:

#include

查找策略:直接去标准路径底下查找头文件,找不到就提示编译错误。

  • 总结:
    对于库文件我们可以使用“”的形式去包含,但是这样查找的效率就低一些,而且这样也不容易区分是库文件还是本地文件。

Linux环境的标准头文件的路径:

/usr/include

VS环境的标准头文件的路径:
vs2013默认路径

c:\program Files (x86)\microsoft Visual studio 12.0\vc\include

3.6.2 嵌套文件包含

嵌套文件包含图:

可以看到test.h和test.c的公共模块里面包含了两份common.h和common.c公共模块,这样文件内容就重复了。

嵌套文件包含的处理方式:
我们为了解决问题,使用条件编译
两种方法:

#ifndef __TEST_H//根据文件的名字去写
#define __TEST_H
//头文件的内容
#endif//结束标志

或者:

#pragma once//编译提示,头文件只包含一次

四、其他预处理指令

#error
#pragma
#line
……