当前位置：首页 > article >正文

C 语言 “神秘武器”：联合体与枚举大揭秘！

article 2025/2/26 7:15:59

在 C 语言里，除了常见的基本数据类型，还有一些自定义类型，它们能帮助我们更灵活地组织和管理数据。今天我们就来详细聊聊其中的联合体和枚举类型。

1. 联合体

1.1 联合体类型的声明

联合体（Union），也叫共用体，它的声明语法和结构体很相似。声明一个联合体，我们使用 union 关键字，后面跟上联合体的名称，然后在花括号里列出联合体的成员。示例如下：

#include <stdio.h>

// 声明一个联合体
union Data {
    int i;
    float f;
    char str[20];
};

在这个例子中，我们声明了一个名为 Data 的联合体，它包含三个成员：一个 int 类型的 i，一个 float 类型的 f，还有一个字符数组 str。

1.2 联合体的特点

联合体的最大特点就是所有成员共享同一块内存空间。也就是说，在同一时间，联合体只能存储一个成员的值。当我们给一个成员赋值时，其他成员的值就会被覆盖。以下是一个示例：

#include <stdio.h>

union Data {
    int i;
    float f;
    char str[20];
};

int main() {
    union Data data;

    data.i = 10;
    printf("data.i: %d\n", data.i);

    data.f = 220.5;
    printf("data.f: %f\n", data.f);

    // 此时 data.i 的值已经被覆盖，输出结果无意义
    printf("data.i: %d\n", data.i); 

    return 0;
}

在这个程序中，我们先给 data.i 赋值为 10，然后打印它的值。接着给 data.f 赋值为 220.5，再打印 data.f 的值。这时，由于 data.f 覆盖了原来存储 data.i 的内存空间，所以再打印 data.i 时，输出的结果就没有意义了。

1.3 相同成员的结构体和联合体对比

结构体和联合体在声明上很相似，但它们的内存使用方式截然不同。结构体的每个成员都有自己独立的内存空间，各个成员可以同时存储不同的值；而联合体的所有成员共享同一块内存空间，同一时间只能存储一个成员的值。以下是一个对比示例：

#include <stdio.h>

// 定义一个结构体
struct StructData {
    int i;
    float f;
    char str[20];
};

// 定义一个联合体
union UnionData {
    int i;
    float f;
    char str[20];
};

int main() {
    struct StructData structData;
    union UnionData unionData;

    printf("Size of struct StructData: %zu bytes\n", sizeof(structData));
    printf("Size of union UnionData: %zu bytes\n", sizeof(unionData));

    return 0;
}

运行这个程序，你会发现结构体的大小是其所有成员大小之和，而联合体的大小是其最大成员的大小。

1.4 联合体大小的计算

联合体的大小计算遵循以下规则：

我们可以使用枚举类型定义变量，然后给变量赋值为枚举常量。示例如下：

联合体的大小至少是最大成员的大小。因为联合体要能容纳最大的成员。
如果最大成员的大小不是某个基本数据类型大小的整数倍，那么联合体的大小会调整为该基本数据类型大小的整数倍，以满足内存对齐的要求。

示例如下：

union Un1
{
    char c[5];
    int i;
};

成员大小：
- char c[5]：char 类型每个元素占 1 字节，数组 c 包含 5 个元素，所以 c 占 5 字节。
- int i：int 类型通常占 4 字节。
对齐数：
- char 类型对齐数为 1，char c[5] 整体对齐数也是 1。
- int 类型对齐数为 4。
- 联合体 Un1 的最大对齐数是 4。
大小确定：虽然 char c[5] 大小为 5 字节，但要满足最大对齐数 4 的整数倍，所以 union Un1 的大小为 8 字节。

列2：

union Un2
{
    short c[7];
    int i;
};

成员大小：
- short c[7]：short 类型每个元素占 2 字节，数组 c 包含 7 个元素，所以 c 占 2 * 7 = 14 字节。
- int i：int 类型通常占 4 字节。
对齐数：
- short 类型对齐数为 2，short c[7] 整体对齐数也是 2。
- int 类型对齐数为 4。
- 联合体 Un2 的最大对齐数是 4。
大小确定：short c[7] 大小为 14 字节，要满足最大对齐数 4 的整数倍，大于 14 且是 4 的整数倍的最小数是 16，所以 union Un2 的大小为 16 字节。

1.5 联合的⼀个练习

我们可以用联合体判断大小端的存储

1. 大小端字节序的概念

在计算机中，多字节数据（如 int 类型，通常占 4 个字节）在内存中存储时，存在两种不同的字节序：

大端字节序（Big Endian）：数据的高位字节存放在内存的低地址处，低位字节存放在内存的高地址处。可以类比为 “高位在前”，就像我们写数字时从高位开始写。
小端字节序（Little Endian）：数据的低位字节存放在内存的低地址处，高位字节存放在内存的高地址处。可以类比为 “低位在前”。

2. 联合体（`union`）的特性

联合体的所有成员共享同一块内存空间，也就是说，联合体的不同成员在内存中起始地址是相同的。在这个函数中，定义了一个匿名联合体 un，它包含两个成员：一个 int 类型的 i 和一个 char 类型的 c。这意味着 i 和 c 会从内存的同一个位置开始存储。

#include <stdio.h>

int check_sys()
{
    union
    {
        int i;
        char c;
    } un;
    un.i = 1;
    return un.c; // 返回 1 是小端，返回 0 是大端
}

int main()
{
    int result = check_sys();
    if (result == 1)
    {
        printf("当前系统是小端字节序。\n");
    }
    else
    {
        printf("当前系统是大端字节序。\n");
    }
    return 0;
}

3.1 联合体的定义

union
{
    int i;
    char c;
} un;

这里定义了一个匿名联合体 un，其中 i 是 int 类型，通常占 4 个字节；c 是 char 类型，占 1 个字节。由于联合体的特性，i 和 c 共享同一块内存空间。

3.2 给 `int` 类型成员赋值

un.i = 1;

将 un.i 赋值为 1。在二进制中，整数 1 用 32 位（假设 int 为 32 位）表示为 0000 0000 0000 0000 0000 0000 0000 0001。

3.3 根据字节序判断返回值

return un.c;

小端字节序情况：在小端字节序中，数据的低位字节存放在内存的低地址处。整数 1 的二进制表示中，最低位字节是 0000 0001，由于 char 类型的 c 只占 1 个字节，且和 i 共享内存起始位置，所以 c 会取到 0000 0001，即十进制的 1。因此，当返回值为 1 时，表示当前系统是小端字节序。
大端字节序情况：在大端字节序中，数据的高位字节存放在内存的低地址处。整数 1 的二进制表示中，最高位字节是 0000 0000，c 会取到 0000 0000，即十进制的 0。所以，当返回值为 0 时，表示当前系统是大端字节序。

2. 枚举类型

2.1 枚举类型的声明

枚举（Enum）类型是一种用户自定义的数据类型，它用于定义一组命名的整数常量。声明枚举类型使用 enum 关键字，后面跟上枚举类型的名称，然后在花括号里列出枚举常量。示例如下：
```
#include <stdio.h>

// 声明一个枚举类型
enum Weekday {
    MONDAY,
    TUESDAY,
    WEDNESDAY,
    THURSDAY,
    FRIDAY,
    SATURDAY,
    SUNDAY
};
```
在这个例子中，我们声明了一个名为 Weekday 的枚举类型，它包含了一周七天的枚举常量。默认情况下，第一个枚举常量的值为 0，后面的常量依次递增 1。所以 MONDAY 的值为 0，TUESDAY 的值为 1，以此类推。

2.2 枚举类型的优点
提高代码可读性：使用枚举常量可以让代码更具可读性，比如在表示一周七天时，使用 MONDAY、TUESDAY 等比直接使用数字 0、1 更直观。
方便代码维护：如果需要修改枚举常量的值，只需要在枚举类型的声明处修改，而不需要在整个代码中查找和修改所有使用该值的地方。
类型安全：枚举类型是一种特定的数据类型，编译器可以进行类型检查，避免一些潜在的错误。

2.3 枚举类型的使用

我们可以使用枚举类型定义变量，然后给变量赋值为枚举常量。示例如下：

#include <stdio.h>

enum Weekday {
    MONDAY,
    TUESDAY,
    WEDNESDAY,
    THURSDAY,
    FRIDAY,
    SATURDAY,
    SUNDAY
};

int main() {
    enum Weekday today = WEDNESDAY;

    switch (today) {
        case MONDAY:
            printf("Today is Monday.\n");
            break;
        case TUESDAY:
            printf("Today is Tuesday.\n");
            break;
        case WEDNESDAY:
            printf("Today is Wednesday.\n");
            break;
        case THURSDAY:
            printf("Today is Thursday.\n");
            break;
        case FRIDAY:
            printf("Today is Friday.\n");
            break;
        case SATURDAY:
            printf("Today is Saturday.\n");
            break;
        case SUNDAY:
            printf("Today is Sunday.\n");
            break;
        default:
            printf("Invalid weekday.\n");
    }

    return 0;
}

在这个程序中，我们定义了一个 Weekday 类型的变量 today，并将其赋值为 WEDNESDAY。然后使用 switch 语句根据 today 的值输出相应的信息。

综上所述，联合体和枚举类型都是 C 语言中非常有用的自定义类型，它们能帮助我们更好地组织和管理数据，提高代码的可读性和可维护性。在实际编程中，我们可以根据具体的需求选择合适的类型来使用。

查看全文

http://www.kler.cn/a/561417.html