当前位置: 首页 > article >正文

位图(C语言版)

文章目录

  • 位图
    • 模型
    • 基本操作
    • 实现
      • 代码
      • 运行结果
    • 应用
      • 存储只有两种状态的数据
      • 排序并去重

位图

模型

位图是“位”的数组。

为什么需要构建一个专门的数据结构来表示位的数组?:因为计算机最小的寻址单位是字节,而不是位。

位图是一种内存紧凑的数据结构,即位图在内存资源紧张的设备中更多使用,如嵌入式设备等。

基本操作

  • 增 set:将某一位设置为1
  • 删 unset:将某一位设置为0
  • 查 isset:判断某一位是不是1
  • 遍历

实现

代码

// 位运算技巧
n * 32 等价于 n << 5   /* 2^5 = 32 */
n / 32 等价于 n >> 5
n % 32 等价于 n & 0x1F /* 与31(MASK)相与 */
n |= 0x1 << offset    /* 将n的第offset位设置为1 */
n &= ~(0x1 << offset) /* 将n的第offset位设置为0 */

位图要求尽可能少地使用内存空间,所以实际使用多少内存,就申请多少内存。

// BitMap.h
#include <stdbool.h>
#include <stdint.h>

typedef uint32_t Word;   // uint32_t: 1.大小确定 (32bits);  2.无符号整数

typedef struct {
    Word* array;   
    size_t bits;	    // 位数组的长度
} BitMap;

BitMap* bitmap_create(size_t bits);
void bitmap_destroy(BitMap* bm);

void bitmap_set(BitMap* bm, size_t n);	// n is a bit index
void bitmap_unset(BitMap* bm, size_t n);
bool bitmap_isset(BitMap* bm, size_t n);
void bitmap_clear(BitMap* bm);
// BitMap.c
#include "BitMap.h"
#include <stdlib.h>
#include <string.h>
#include <stdio.h>

#define BITS_PER_WORD 32
#define BITMAP_SHIFT 5
#define BITMAP_MASK 0x1F
// 存储bits位,需要多少个word
#define BITMAP_SIZE(bits) ((bits + BITS_PER_WORD - 1) >> BITMAP_SHIFT)

// 位图的长度
BitMap* bitmap_create(size_t bits) {
    BitMap* bm = (BitMap*)malloc(sizeof(BitMap));

    bm->array = (Word*)calloc(BITMAP_SIZE(bits), BITS_PER_WORD);
    bm->bits = bits;

    return bm;
}

void bitmap_destroy(BitMap* bm) {
    // 1. 释放array
    free(bm->array);

    // 2. 释放BitMap
    free(bm);
}

void grow_capacity(BitMap* bm, size_t bits) {
    Word* newArray = (Word*)realloc(bm->array, BITMAP_SIZE(bits) * sizeof(Word));
    bm->array = newArray;

    // realloc 并不会自动将扩容的空间清零,需要手动清零
    int bytes = (BITMAP_SIZE(bits) - BITMAP_SIZE(bm->bits)) * sizeof(Word);
    memset(bm->array + BITMAP_SIZE(bm->bits), 0, bytes);
}

void bitmap_set(BitMap* bm, size_t n) {	// n is a bit index
    // 需判断索引n是否在位图范围内
    if (n + 1 > bm->bits) { // 这里不一定要扩容,但要改变bm->bits
        if (BITMAP_SIZE(n + 1) > BITMAP_SIZE(bm->bits)) { // 不在BitMap范围内,需扩容
            // 扩容
            grow_capacity(bm, n + 1);
        }
        bm->bits = n + 1;
    }
    // 如何表示第n位(word, offset)
    size_t word = n >> BITMAP_SHIFT; // 该索引在哪个word块中
    size_t offset = n & BITMAP_MASK; // 等价于 n % BITS_PER_WORD (取余操作),表示该索引在该word块的offset位

    bm->array[word] |= (0x01 << offset);
}

void bitmap_unset(BitMap* bm, size_t n) {
    // 需判断索引n是否在位图范围内
    if (n + 1 > bm->bits) { // 这里不一定要扩容,但要改变bm->bits
        if (BITMAP_SIZE(n + 1) > BITMAP_SIZE(bm->bits)) { // 不在BitMap范围内,需扩容
            // 扩容
            grow_capacity(bm, n + 1);
        }
        bm->bits = n + 1;
    }

    // 如何表示第n位(word, offset)
    size_t word = n >> BITMAP_SHIFT; // 该索引在哪个word块中
    size_t offset = n & BITMAP_MASK; // 等价于 n % BITS_PER_WORD (取余操作),表示该索引在该word块的offset位

    bm->array[word] &= ~(0x01 << offset);
}

bool bitmap_isset(BitMap* bm, size_t n) {
    // 需判断索引n是否在位图范围内
    if (n + 1 > bm->bits) {
        printf("索引n不在位图范围内\n");
        return false;
    }

    // 如何表示第n位(word, offset)
    size_t word = n >> BITMAP_SHIFT; // 该索引在哪个word块中
    size_t offset = n & BITMAP_MASK; // 等价于 n % BITS_PER_WORD (取余操作),表示该索引在该word块的offset位

    return bm->array[word] & (0x1 << offset);
}

void bitmap_clear(BitMap* bm) {
    // 全部置零
    int bytes = BITMAP_SIZE(bm->bits) * sizeof(Word);
    memset(bm->array, 0, bytes);
}
// main.c
#include <stdio.h>
#include "BitMap.h"

int main() {
    BitMap* bm = bitmap_create(100);
    int bits_per_word = 8 * sizeof(bm->array[0]);
    printf("位图使用了%d 位的空间,实际开辟的内存空间%d\n", bm->bits, bits_per_word * (1 + bm->bits / bits_per_word));
    
    bitmap_set(bm, 80);
    printf("第80位的值为:%d\n", bitmap_isset(bm, 80));
    bitmap_unset(bm, 80);
    printf("第80位的值为:%d\n", bitmap_isset(bm, 80));

    bitmap_set(bm, 130); // 扩容
    printf("位图使用了%d 位空间,实际开辟的内存空间%d\n", bm->bits, bits_per_word * (1 + bm->bits / bits_per_word));

    bitmap_clear(bm);
    printf("第0~50位的值为:");
    for (int i = 0; i < 50; i++) {
        printf(" %d", bitmap_isset(bm, i));
    }

    bitmap_destroy(bm);

    return 0;
}

运行结果

在这里插入图片描述

应用

存储只有两种状态的数据

比如,存储10亿 ( 1 0 9 ≈ 2 30 10^{9} \approx 2^{30} 109230) QQ用户的在线状态:

  • 如果用int数组存储,那么需要的存储空间为:4B * 2^30 = 4GB
  • 如果用位图存储,所需空间位:1/8B * 2^30 = 0.125GB

排序并去重

比如排序数组int array[] = {123, 456, 3, 7, 8, 9, 34, 3, 7, 3};并去重

  • 如果用平常方法:需要先对数组进行排序(快速排序O(nlog(n)),然后对排序后的数组去重 (O(n))
  • 使用位图,可以将数组array的值对应为位图的位索引, 比如数组第一个值为123, 那么就将位图索引为128的位设置为1,对其他数组值也进行相同处理。最后输出位图中值为1的位对应索引即可。时间复杂度为O(n)

http://www.kler.cn/a/547477.html

相关文章:

  • 前后端的身份认证
  • 基于微信小程序校园订餐的设计与开发(ssm论文源码调试讲解)
  • npm版本号标记
  • 输电杆塔沉降智能监测系统:如何用数据守护电网安全
  • 【一文读懂】WebRTC协议
  • 消息中间件深度剖析:以 RabbitMQ 和 Kafka 为核心
  • (学习总结23)Linux 目录、通配符、重定向、管道、shell、权限与粘滞位
  • webassembly009 transformers.js 网页端侧推理 whisper-web
  • 「软件设计模式」装饰者模式(Decorator)
  • POI 的 Excel 读写操作教程
  • 2025年:人工智能驱动下运维自动化新方向
  • 1.【BUUCTF】[SUCTF 2019]EasyWeb
  • 通过例子学 rust 个人精简版 1-1
  • 计算机基础-内存分配
  • java八股---java05(类、泛型、JVM、线程)
  • 先验期望准则
  • ORB-SLAM3的源码学习: Settings.cc:settings构造函数
  • 【吾爱出品】针对红警之类老游戏适用WIN10和11的补丁cnc-ddraw7.1汉化版
  • Beszel监控Docker安装
  • SQL Server STUFF 函数的用法及应用场景