【C语言】一篇让你彻底吃透(结构体与结构体位段)
本章重点
主要讲解结构体和位移动的使用和定义与声明,并且结构体和位段在内存中是如何存储的。
文章目录
- 结构体
- 结构体类型的声明
- 结构体特殊的声明
- 结构体变量的定义和初始化
- 结构体成员的访问
- 结构的自引用
- 结构体内存对齐
- 结构体传参
- 位段
- 什么是位段
- 位段的内存分配
- 位段的跨平台问题
结构体
结构体类型的声明
结构是一些值的集合,这些值称为成员变量。结构的每个成员可以是不同类型的变量。
例如用结构体描述一个学生:
struct Stu
{
//结构体成员变量
char name[20];//名字
int age;//年龄
char sex[5];//性别
char id[20];//学号
}; //分号不能丢
- struct 结构体关键字
- stu结构体标签 (标签可以自己随便起)
- struct stu - 结构体类型
- 结构的成员可以是标量、数组、指针,甚至是其他结构体。
结构体特殊的声明
在声明结构的时候,可以不完全的声明,但是这样只能调用一次。
匿名结构体类型
只能调用一次,因为没有结构体标签
//匿名结构体类型 struct { int a; char b; float c; }x; //(但是这样写只能调用一次x,因为没有结构体标签)
结构体变量的定义和初始化
有了结构体类型,那如何定义变量和初始化呢,其实很简单。
- 结构体定义:
struct stu
{
char name[20];//名字
int age;//年龄
char sex[5];//性别
char id[20];//学号
}s1,s2,s3; 全局变量的定义
struct stu s4; 全局变量的定义
int main()
{
struct stu s5; 局部变量定义
struct stu s6; 局部变量定义
return 0;
}
如果结构体名字过长,我们也可以typedef一下,但是typedef时注意,想在此地方加全局变量是不允许的,如果此时想要创造全局变量应该像上代码s4一样创造。
- 结构体初始化
struct stu
{
char name[20];//名字
int age;//年龄
char sex[5];//性别
char id[20];//学号
}s1 = { "wangwu",25,"sex","2022333" };
struct stu s1 = { "lihua",18,"sex","2022111" }; //全局变量的初始化
int main()
{
struct stu s2 = { "lisi",20,"sex","2022222" };//局部变量初始化
return 0;
}
结构体成员的访问
结构体变量如何访问成员?
结构变量的成员是通过点操作符(.)访问的。点操作符接受两个操作数。
结构变量的成员也可以通过->箭头来访问。
那(.)和->到底使用那个呢?
- 点(.)是用于结构体变量访问成员
- 箭头(->)是用于结构体指针访问成员。
- 点(.)是用于结构体变量访问成员
#include<stdio.h>
struct stu
{
char name[20];//名字
int age;//年龄
char sex[5];//性别
char id[20];//学号
};
void test1(struct stu q1)
{
//通过 . 来访问
printf("%s\n", q1.name);
printf("%d\n", q1.age);
printf("%s\n", q1.sex);
printf("%s\n", q1.id);
}
int main()
{
struct stu s1 = { "lisi",20,"sex","2022222" };//局部变量初始化
test1(s1);
return 0;
}
- 箭头(->)是用于结构体指针访问成员。
#include<stdio.h>
struct stu
{
char name[20];//名字
int age;//年龄
char sex[5];//性别
char id[20];//学号
};
void test2(struct stu* q1)
{
//通过 . 来访问
printf("%s\n", q1->name);
printf("%d\n", q1->age);
printf("%s\n", q1->sex);
printf("%s\n", q1->id);
}
int main()
{
struct stu s1 = { "lisi",20,"sex","2022222" };//局部变量初始化
test2(&s1);
return 0;
}
结构的自引用
在结构中包含一个类型为该结构本身的成员是否可以呢?
答案是 可以的。
但是必须写成指针的形式。如果写成以下这样是错误的,会一直套娃下去,根本不知道该结构体大小是多少
- 错误的写法
struct Node
{
int data;
struct Node next;
};
- 正确的写法应该写成指针的形式
struct Node
{
int data;
struct Node* next;
};
结构体内存对齐
我们已经掌握了结构体的基本使用了。
现在我们深入讨论一个问题:计算结构体的大小。
- 看看以下代码输出的是什么
struct S1
{
int a;
char c;
};
int main()
{
int ret = sizeof(struct S1);
printf("%d\n", ret);
return 0;
}
很多人一开始以为是5,但并不是的。
答案是8,那为什么呢,这就与结构体内存对齐相关了
- 如何计算结构体内存?
首先得掌握结构体的对齐规则:
- .结构体的第一个成员永远都放在0偏移处
- 从第二个成员开始,以后的每个成员都要对齐到某个(对齐数)的整数倍地址处.(取对齐数较小值)
对齐数 = 编译器默认的一个对齐数 与 该成员大小的较小值。 -
备注:
VS 环境下 默认对齐数是8
gcc 环境下 没有默认对齐数,没有默认对齐数时,对齐数就是成员自身的大小- 当成员全部存放进去后, 结构体的总大小必须是,所有成员的对齐数中最大对齐数的整数倍如果不够,则浪费空间对齐.
- 如果嵌套了结构体,嵌套的结构体成员要对齐到自己成员的最大对齐数的整数倍处,整个结构体的大小,必须是最大对齐数的整数倍,最大对齐数包含中嵌套的结构体成员中的对齐数
我们直接上练习理解
- 练习 1 (sizeof(struct S1)输出结果是什么)
struct S1
{
char c1;
int i;
char c2;
};
printf("%d\n", sizeof(struct S1));
答案是->12
- 练习 2 (sizeof(struct S2)输出结果是什么)
struct S2
{
char c1;
char c2;
int i;
};
printf("%d\n", sizeof(struct S2));
答案是->8
- 练习 3(sizeof(struct S3)输出结果是什么)
struct S3
{
double d;
char c;
int i;
};
printf("%d\n", sizeof(struct S3));
答案是->16
- 练习4-结构体嵌套问题,以下输出的是什么
struct S3
{
int d;
char c;
int i;
};
struct S4
{
char c1;
struct S3 s3;
int d;
};
printf("%d\n", sizeof(struct S4));
答案是20
为什么存在内存对齐?
大部分的参考资料都是如是说的:
- 平台原因(移植原因):
不是所有的硬件平台都能访问任意地址上的任意数据的;某些硬件平台只能在某些地址处取某些特定类型的数据,否则抛出硬件异常。- 性能原因
数据结构(尤其是栈)应该尽可能地在自然边界上对齐。
原因在于,为了访问未对齐的内存,处理器需要作两次内存访问;而对齐的内存访问仅需要一次访问。总体来说:
结构体的内存对齐是拿空间来换取时间的做法。
那在设计结构体的时候,我们既要满足对齐,又要节省空间,如何做到:
让占用空间小的成员尽量集中在一起。
//例如:
struct S1
{
char c1;
int i;
char c2;
};
struct S2
{
char c1;
char c2;
int i;
};
S1和S2类型的成员一模一样,但是S1和S2所占空间的大小有了一些区别。
s1 内存是12个字节
s2 内存是8个字节
结构体传参
struct S
{
int data[1000];
int num;
};
struct S s = { {1,2,3,4}, 1000 };
//结构体传参
void print1(struct S s)
{
printf("%d\n", s.num);
}
//结构体地址传参
void print2(struct S* ps)
{
printf("%d\n", ps->num);
}
int main()
{
print1(s); //传结构体
print2(&s); //传地址
return 0;
}
上面的 print1 和 print2 函数哪个好些?
答案是:首选print2函数。
函数传参的时候,参数是需要压栈,会有时间和空间上的系统开销。
如果传递一个结构体对象的时候,结构体过大,参数压栈的的系统开销比较大,所以会导致性能的下降。结论:
结构体传参的时候,要传结构体的地址。
位段
结构体讲完就得讲讲结构体实现 位段 的能力。
什么是位段
有些数据在存储时并不需要占用一个完整的字节,只需要占用一个或几个二进制位即可。为了充分利用好内存空间,C语言又提供了一种叫做位段的数据结构
位段能够减少储存数据的位数
信息的存取一般以字节为单位
位段的声明和结构是类似的,有两个不同:
- 位段的成员必须是 int、unsigned int 或signed int 。
- 位段的成员名后边有一个冒号和一个数字。
- : 后面的数字用来限定成员变量占用的位数
- 在结构体定义时,指定某个成员变量所占用的是二进制位数(Bit)
例如:
struct A
{
int _a:2;
int _b:5;
int _c:10;
int _d:30;
};
他们虽然是int类型,在内存占32个比特位,但是 位段限制了他们所占的空间,比如a只能占2个bit,b占5个bit,c占10个bit位,d占10个bit位。
A就是一个位段类型。
那位段A的大小是多少?
printf("%d\n", sizeof(struct A))
;- 答案是->8 ,为什么呢?那就关于位段的内存分配了。s
位段的内存分配
- 位段的成员可以是 int unsigned int signed int 或者是 char (属于整形家族)类型
- 位段的空间上是按照需要以4个字节( int )或者1个字节( char )的方式来开辟的。
- 位段涉及很多不确定因素,位段是不跨平台的,注重可移植的程序应该避免使用位段。
struct S
{
char a : 3;
char b : 4;
char c : 5;
char d : 4;
};
int main()
{
struct S s = { 0 };
s.a = 10;
s.b = 12;
s.c = 3;
s.d = 4;
system("pause");
}
改代码内存空间是如何开辟的!?图解:
总结:
- vs 分配到的内存中的比特位是由右向左使用
- 分配的内存剩余的比特位不够使用时,浪费掉
位段的跨平台问题
- int 位段被当成有符号数还是无符号数是不确定的。
- 位段中最大位的数目不能确定。(16位机器最大16,32位机器最大32,写成27,在16位机器会出问题。
- 位段中的成员在内存中从左向右分配,还是从右向左分配标准尚未定义。
- 当一个结构包含两个位段,第二个位段成员比较大,无法容纳于第一个位段剩余的位时,是舍弃剩余的位还是利用,这是不确定的
总结:
跟结构相比,位段可以达到同样的效果,但是可以很好的节省空间,但是有跨平台的问题存在。