C语言--结构体的大小与内存对齐,位段详解
一.前言
为了保证文章的质量和长度,小编将会分两篇介绍,思维导图如下,上篇已经讲过了概念部分,本文主要讲解剩余部分,希望大家有所收获🌹🌹
二.结构体的大小与内存对齐
2.1 存在对齐的原因
- 平台原因(移植原因):不是所有的硬件平台都能访问任意地址上的任意数据的;某些硬件平台只能在某些地址处取某些特定类型的数据,否则抛出硬件异常
- 性能原因:数据结构(尤其是栈)应该尽可能地在自然边界上对齐。
原因在于,为了访问未对齐的内存,处理器需要做两次内存访问;而对齐的内存访问仅需要一次访问。(假设一个处理器总是从内存中取8个字节,则地址必须是8的倍数,那么就可以用一个内存操作来读或者写值了,否则,我们可能需要执行两次内存访问,因为对象可能被分放在两个8字节内存块中)
<总的来说>:结构体的内存对齐就是拿空间换取时间的做法
2.2 规则
- 结构体的第⼀个成员对齐到和结构体变量起始位置偏移量为0的地址处
- 其他成员变量要对齐到某个数字(对齐数)的整数倍的地址处。
对齐数 = 编译器默认的⼀个对齐数 与 该成员变量大小的较小值
·VS 中默认的值为 8
·Linux中 gcc 没有默认对齐数,对齐数就是成员自身的大小 - 结构体总大小为最大对齐数(结构体中每个成员变量都有⼀个对齐数,所有对齐数中最大的)的整数倍。
- 如果嵌套了结构体的情况,嵌套的结构体成员对齐到自己的成员中最大对齐的整数倍处,
结构体的整体大小就是所有最大对齐数(含嵌套结构体中成员的对齐数)的整数倍
示例:
- 在设计结构体时,我们如何做到既满足对齐,又节省空间呢?
答:让占用空间小的成员尽量集中在一起 例如:
2.3 #pragma修改默认对齐数
#pragma是一个预处理指令,用于修改默认对齐数,其中
示例如下:
- 注意:别忘了
对齐数 = 编译器默认的⼀个对齐数 与 该成员变量大小的较小值
结构体总大小为最大对齐数(结构体中每个成员变量都有⼀个对齐数,所有对齐数中最大的)的整数倍。
三.结构体实现位段
3.1 什么是位段
位段是C语言中的一种特殊数据类型,它允许讲一个字节分成几个部分,并为每个部分指定特定的位数,以便在内存中存储和访问这些部分。
结构和联合中的int类型以及unsigned类型成员可以声明为指定的二进制位宽,这样的成员被称为位字段或者“位域”。
位段的声明和结构体是类似的,有两个不同:
- 位段的成员必须是int、unsigned或signed int,在C99中位段成员的类型也可以选择其他类型
- 位段的成员名后边有一个冒号和一个数字
3.2 位段的内存分配
- 位段的空间上是按照需要以4个字节(int)或者1个字节(char)的方式来开辟的。
- 位段涉及很多不确定因素,位段是不跨平台的,注重可移植的程序应该避免使用位段
- 给定了空间后,在空间内部是从左向右使用还是从右向左使用是不确定的 注意:下面我给出的示例都是假设从右向左的
- 当剩下的空间不足以存放下一个成员时,空间是浪费还是使用不确定假设:浪费
例1:
例2:
3.3 位段的跨平台问题
跟结构体相比,位段可以达到同样的效果,并且可以很好的节省空间,但是有跨平台的问题出现
- int位段被当成有符号数还是无符号数是不确定的
- 位段中最大位的数目不能确定(16位机器最大16 32位机器最大32 这意味着若在16位机器上写的数目超过16会出问题)
- 位段中的成员在内存中从左向右还是从右向左分配标准尚未定义
- 当一个结构包含两个位段,第二个位段成员比较大无法容纳于第一个位段剩余的位时,浪费or使用不确定
3.4 位段使用的注意事项
位段的几个成员共用同一个字节,这样有些成员的起始位置并不是某个字节的起始位置,那么这些位置处是没有地址的,所以不能对位段成员用&,这样也就不能用scanf直接给位段输入值,只能先输入放在一个变量中,然后赋值给位段的成员。
四.总结
结构体、位段的讲解在次就全部讲解完毕了,创作不易,希望大家多多支持,有什么想法欢迎讨论🌹🌹