纸上得来终觉浅, 绝知此事要躬行。
主页:June-Frost
专栏:C语言

该文章将探讨结构体,位段,共用体的存储形式。

目录:

  • 结构体内存对齐
    • ✉️修改默认对齐数
  • 位段
  • 联合
  • ❤️ 结语

结构体内存对齐

 结构体(struct)是一种用于存储一组不同类型数据的复合数据类型。为了提高内存访问效率,许多计算机系统对结构体进行内存对齐。内存对齐是一种优化内存访问效率的方式,通过将数据存储在特定的内存地址上,使得CPU的内存访问速度更快。对于一些特定的硬件平台和体系结构,内存对齐的要求是必需的。为了更好的理解,我们可以通过计算结构体的大小引入。

struct S1{char c1;int i;char c2;};//大小为12
struct S2{int i;char c1;char c2;};//大小为8
struct S3{char c3;struct S1;char c4;};//大小为20

 通过offsetof计算一下结构体(S1)成员相较于结构体起始位置的偏移量,发现分别是0,4,8 。
这也就意味着S1在内存中的分布是这样的:

 通过上面的现象分析,可以发现结构成员不是按照顺序在内存中连续存放的,而是有一定的对齐规则。

结构体内存对齐的规则:

  1. 第一个成员永远存放在与结构体变量偏移量为0的地址处。
  2. 从第二个成员开始,往后的每个成员都要对齐到某个对齐数的整数倍处。

对齐数:结构体成员自身的大小和默认对齐数的较小值。
VS 上默认对齐数是8。
gcc上没有默认对齐数,对齐数就是结构体成员自身的大小。

  1. 结构体的总大小,必须是最大对齐数的整数倍。

最大对齐数:所有成员的对齐数中最大的值。

  1. 如果嵌套了结构体的情况,嵌套的结构体对齐到自己的最大对齐数的整数倍处。

为什么会有内存对齐呢?

1.平台原因(移植原因):
不是所有的硬件平台都能访问任意地址上的任意数据的;某些硬件平台只能在某些地址处取某些特定类型的数据,否则抛出硬件异常。
2.性能原因:
数据结构(尤其是栈)应该尽可能地在自然边界上对齐。原因在于,为了访问未对齐的内存,处理器需要作两次内存访问;而对齐的内存访问仅需要一次访问。

总的来说,结构体的内存对齐是拿空间来换取时间的做法。

 所以我们在设计结构体的时候,既要满足对齐,又要节省空间:让占用空间小的成员尽量集中在一起。

struct S1{char c1;int i;char c2;};struct S2{int i;char c1;char c2;};

这两个结构体的成员一摸一样,但是S1需要12个字节,而S2只需要8个字节。

✉️修改默认对齐数

通过 #pragma 这个预处理指令,就可以改变默认对齐数。
例如:

#include#pragma pack(1)//设置默认对齐数为1struct S1{char c1;int i;char c2;};#pragma pack()//取消设置的默认对齐数,还原为默认int main(){printf("%zd", sizeof(struct S1));//结果为6return 0;}

位段

 位段是 C 语言中的一种数据类型,用于将一组数值存储到计算机内存中的二进制位中。位段通常用于在内存节省空间的同时,以一种可读性较高的方式存储多个二进制标志或数据。每个位段可以指定其所占用的二进制位数。

⚠注意:

  1. 位段的成员可以是 int ,unsigned int ,signed int 或者是 char (属于整形家族)类型。
  2. 位段的空间上是按照需要以4个字节( int )或者1个字节( char )的方式来开辟的。
  3. 位段涉及很多不确定因素,位段是不跨平台的,注重可移植的程序应该避免使用位段。

由于位段不跨平台,所以在此浅谈一下VS的位段存储。

#includestruct S {char a : 3;char b : 4;char c : 5;char d : 4;};int main(){struct S s = { 0 };s.a = 10;s.b = 12;s.c = 3;s.d = 4;printf("%d", sizeof(s));return 0;}



事实确实如此:

位段在网络底层非常有用,例如:IP数据包的格式。


联合

 联合体(union)是一种特殊的数据类型,它允许在内存中创建多个变量,但只能存储其中一个变量的值。联合体的目的是节省内存空间,因为它可以重复利用同一块内存存储不同的变量值。

⚠规则:

  1. 联合的大小至少是最大成员的大小。
  2. 最大成员大小不是最大对齐数的整数倍的时候,就要对齐到最大对齐数的整数倍。
union Un{char c[5];//对齐数是1int i;//对齐数是4};//最大对齐数是4//大小为8字节

char c[5] 的大小为5字节,int i 的大小为4字节,所以至少为5个字节,但是这里最大对齐数是4,所以总大小会增加至 8个字节。


❤️ 结语

 文章到这里就结束了,如果对你有帮助,你的点赞将会是我的最大动力,如果大家有什么问题或者不同的见解,欢迎大家的留言~