C 语言 “神秘武器”:联合体与枚举大揭秘!
在 C 语言里,除了常见的基本数据类型,还有一些自定义类型,它们能帮助我们更灵活地组织和管理数据。今天我们就来详细聊聊其中的联合体和枚举类型。
1. 联合体
1.1 联合体类型的声明
联合体(Union),也叫共用体,它的声明语法和结构体很相似。声明一个联合体,我们使用 union
关键字,后面跟上联合体的名称,然后在花括号里列出联合体的成员。示例如下:
#include <stdio.h>
// 声明一个联合体
union Data {
int i;
float f;
char str[20];
};
在这个例子中,我们声明了一个名为 Data
的联合体,它包含三个成员:一个 int
类型的 i
,一个 float
类型的 f
,还有一个字符数组 str
。
1.2 联合体的特点
联合体的最大特点就是所有成员共享同一块内存空间。也就是说,在同一时间,联合体只能存储一个成员的值。当我们给一个成员赋值时,其他成员的值就会被覆盖。以下是一个示例:
#include <stdio.h>
union Data {
int i;
float f;
char str[20];
};
int main() {
union Data data;
data.i = 10;
printf("data.i: %d\n", data.i);
data.f = 220.5;
printf("data.f: %f\n", data.f);
// 此时 data.i 的值已经被覆盖,输出结果无意义
printf("data.i: %d\n", data.i);
return 0;
}
在这个程序中,我们先给 data.i
赋值为 10,然后打印它的值。接着给 data.f
赋值为 220.5,再打印 data.f
的值。这时,由于 data.f
覆盖了原来存储 data.i
的内存空间,所以再打印 data.i
时,输出的结果就没有意义了。
1.3 相同成员的结构体和联合体对比
结构体和联合体在声明上很相似,但它们的内存使用方式截然不同。结构体的每个成员都有自己独立的内存空间,各个成员可以同时存储不同的值;而联合体的所有成员共享同一块内存空间,同一时间只能存储一个成员的值。以下是一个对比示例:
#include <stdio.h>
// 定义一个结构体
struct StructData {
int i;
float f;
char str[20];
};
// 定义一个联合体
union UnionData {
int i;
float f;
char str[20];
};
int main() {
struct StructData structData;
union UnionData unionData;
printf("Size of struct StructData: %zu bytes\n", sizeof(structData));
printf("Size of union UnionData: %zu bytes\n", sizeof(unionData));
return 0;
}
运行这个程序,你会发现结构体的大小是其所有成员大小之和,而联合体的大小是其最大成员的大小。
1.4 联合体大小的计算
联合体的大小计算遵循以下规则:
我们可以使用枚举类型定义变量,然后给变量赋值为枚举常量。示例如下:
- 联合体的大小至少是最大成员的大小。因为联合体要能容纳最大的成员。
- 如果最大成员的大小不是某个基本数据类型大小的整数倍,那么联合体的大小会调整为该基本数据类型大小的整数倍,以满足内存对齐的要求。
- 示例如下:
union Un1 { char c[5]; int i; };
- 成员大小:
char c[5]
:char
类型每个元素占 1 字节,数组c
包含 5 个元素,所以c
占 5 字节。int i
:int
类型通常占 4 字节。
- 对齐数:
char
类型对齐数为 1,char c[5]
整体对齐数也是 1。int
类型对齐数为 4。- 联合体
Un1
的最大对齐数是 4。
- 大小确定:虽然
char c[5]
大小为 5 字节,但要满足最大对齐数 4 的整数倍,所以union Un1
的大小为 8 字节。
列2:
union Un2
{
short c[7];
int i;
};
- 成员大小:
short c[7]
:short
类型每个元素占 2 字节,数组c
包含 7 个元素,所以c
占 2 * 7 = 14 字节。int i
:int
类型通常占 4 字节。
- 对齐数:
short
类型对齐数为 2,short c[7]
整体对齐数也是 2。int
类型对齐数为 4。- 联合体
Un2
的最大对齐数是 4。
- 大小确定:
short c[7]
大小为 14 字节,要满足最大对齐数 4 的整数倍,大于 14 且是 4 的整数倍的最小数是 16,所以union Un2
的大小为 16 字节。
1.5 联合的⼀个练习
我们可以用联合体判断大小端的存储
1. 大小端字节序的概念
在计算机中,多字节数据(如 int
类型,通常占 4 个字节)在内存中存储时,存在两种不同的字节序:
- 大端字节序(Big Endian):数据的高位字节存放在内存的低地址处,低位字节存放在内存的高地址处。可以类比为 “高位在前”,就像我们写数字时从高位开始写。
- 小端字节序(Little Endian):数据的低位字节存放在内存的低地址处,高位字节存放在内存的高地址处。可以类比为 “低位在前”。
2. 联合体(union
)的特性
联合体的所有成员共享同一块内存空间,也就是说,联合体的不同成员在内存中起始地址是相同的。在这个函数中,定义了一个匿名联合体 un
,它包含两个成员:一个 int
类型的 i
和一个 char
类型的 c
。这意味着 i
和 c
会从内存的同一个位置开始存储。
#include <stdio.h>
int check_sys()
{
union
{
int i;
char c;
} un;
un.i = 1;
return un.c; // 返回 1 是小端,返回 0 是大端
}
int main()
{
int result = check_sys();
if (result == 1)
{
printf("当前系统是小端字节序。\n");
}
else
{
printf("当前系统是大端字节序。\n");
}
return 0;
}
3.1 联合体的定义
union
{
int i;
char c;
} un;
这里定义了一个匿名联合体 un
,其中 i
是 int
类型,通常占 4 个字节;c
是 char
类型,占 1 个字节。由于联合体的特性,i
和 c
共享同一块内存空间。
3.2 给 int
类型成员赋值
un.i = 1;
将 un.i
赋值为 1。在二进制中,整数 1 用 32 位(假设 int
为 32 位)表示为 0000 0000 0000 0000 0000 0000 0000 0001
。
3.3 根据字节序判断返回值
return un.c;
- 小端字节序情况:在小端字节序中,数据的低位字节存放在内存的低地址处。整数 1 的二进制表示中,最低位字节是
0000 0001
,由于char
类型的c
只占 1 个字节,且和i
共享内存起始位置,所以c
会取到0000 0001
,即十进制的 1。因此,当返回值为 1 时,表示当前系统是小端字节序。 - 大端字节序情况:在大端字节序中,数据的高位字节存放在内存的低地址处。整数 1 的二进制表示中,最高位字节是
0000 0000
,c
会取到0000 0000
,即十进制的 0。所以,当返回值为 0 时,表示当前系统是大端字节序。
-
2. 枚举类型
2.1 枚举类型的声明
枚举(Enum)类型是一种用户自定义的数据类型,它用于定义一组命名的整数常量。声明枚举类型使用
enum
关键字,后面跟上枚举类型的名称,然后在花括号里列出枚举常量。示例如下:#include <stdio.h> // 声明一个枚举类型 enum Weekday { MONDAY, TUESDAY, WEDNESDAY, THURSDAY, FRIDAY, SATURDAY, SUNDAY };
在这个例子中,我们声明了一个名为
Weekday
的枚举类型,它包含了一周七天的枚举常量。默认情况下,第一个枚举常量的值为 0,后面的常量依次递增 1。所以MONDAY
的值为 0,TUESDAY
的值为 1,以此类推。2.2 枚举类型的优点
- 提高代码可读性:使用枚举常量可以让代码更具可读性,比如在表示一周七天时,使用
MONDAY
、TUESDAY
等比直接使用数字 0、1 更直观。 - 方便代码维护:如果需要修改枚举常量的值,只需要在枚举类型的声明处修改,而不需要在整个代码中查找和修改所有使用该值的地方。
- 类型安全:枚举类型是一种特定的数据类型,编译器可以进行类型检查,避免一些潜在的错误。
2.3 枚举类型的使用
我们可以使用枚举类型定义变量,然后给变量赋值为枚举常量。示例如下:
#include <stdio.h>
enum Weekday {
MONDAY,
TUESDAY,
WEDNESDAY,
THURSDAY,
FRIDAY,
SATURDAY,
SUNDAY
};
int main() {
enum Weekday today = WEDNESDAY;
switch (today) {
case MONDAY:
printf("Today is Monday.\n");
break;
case TUESDAY:
printf("Today is Tuesday.\n");
break;
case WEDNESDAY:
printf("Today is Wednesday.\n");
break;
case THURSDAY:
printf("Today is Thursday.\n");
break;
case FRIDAY:
printf("Today is Friday.\n");
break;
case SATURDAY:
printf("Today is Saturday.\n");
break;
case SUNDAY:
printf("Today is Sunday.\n");
break;
default:
printf("Invalid weekday.\n");
}
return 0;
}
在这个程序中,我们定义了一个 Weekday
类型的变量 today
,并将其赋值为 WEDNESDAY
。然后使用 switch
语句根据 today
的值输出相应的信息。
综上所述,联合体和枚举类型都是 C 语言中非常有用的自定义类型,它们能帮助我们更好地组织和管理数据,提高代码的可读性和可维护性。在实际编程中,我们可以根据具体的需求选择合适的类型来使用。