当前位置：首页 > article >正文

011-base64

article 2025/3/13 8:34:04

base64

编码

以下是C++实现的Base64字符串加密算法及其原理说明，综合了多个技术文档的核心要点：

一、Base64编码原理

Base64是一种将二进制数据转换为ASCII字符的编码方式，核心原理基于 3字节转4字符的转换规则：

分组规则：每3个字节（24位）分为4组，每组6位（2⁶=64种可能）
编码表：使用64个可打印字符（A-Z, a-z, 0-9, +, /）和填充符=，如A=0, B=1,…, +=62, /=63
填充机制：当数据不足3字节时，用0补齐剩余位，并在结果末尾添加=标识
剩余1字节 → 补4个0 → 结果加==
剩余2字节 → 补2个0 → 结果加=

二、C++实现代码

#include <string>
#include <vector>
 
const std::string BASE64_CHARS = 
    "ABCDEFGHIJKLMNOPQRSTUVWXYZ"
    "abcdefghijklmnopqrstuvwxyz"
    "0123456789+/";
 
std::string base64_encode(const std::string &input) {
    std::string encoded;
    int val = 0, valb = -6;
    unsigned int len = input.length(); 
    
    for (unsigned char c : input) {
        val = (val << 8) + c;  // 合并3字节到24位缓冲区 
        valb += 8;
        while (valb >= 0) {    // 每次提取6位生成编码字符 
            encoded.push_back(BASE64_CHARS[(val  >> valb) & 0x3F]);
            valb -= 6;
        }
    }
    
    // 处理剩余位
    if (valb > -6) {
        encoded.push_back(BASE64_CHARS[((val  << 8) >> (valb + 8)) & 0x3F]);
    }
    
    // 填充等号 
    while (encoded.size()  % 4) {
        encoded.push_back('='); 
    }
    
    return encoded;
}

三、关键实现解析

位操作处理
使用val作为24位缓冲区，通过左移8位合并输入字节
valb记录当前有效位数（-6表示初始需要填充6位）
(val >> valb) & 0x3F提取6位数据（0x3F即二进制00111111）
边界处理
- 剩余位处理：通过(val << 8) >> (valb + 8)获取未处理的尾部数据
- 填充规则：最终长度必须是4的倍数，不足时补=
编码表示
查表时直接使用BASE64_CHARS字符串进行字符映射

四、使用示例

int main() {
    std::string plain = "Hello World!";
    std::string encoded = base64_encode(plain);
    // 输出：SGVsbG8gV29ybGQh
    std::cout << encoded << std::endl; 
    return 0;
}

五、性能优化建议

预分配内存：根据输入长度计算输出长度（(4 * (n/3)) + 4），使用reserve()减少内存重分配
批量处理：通过reinterpret_cast将字符串转为uint32_t数组进行批量位操作
SIMD指令：使用AVX2指令集加速分组计算（需硬件支持）

附：编码过程示例

原始数据：“Man”（ASCII码：77, 97, 110）
二进制形式：01001101 01100001 01101110
6位分组：

010011 → 19 → T

010110 → 22 → W

000101 → 5 → F

101110 → 46 → u

输出结果：TWFu
该实现完整覆盖了Base64标准规范，可通过在线Base64工具（如base64encode.org ）验证结果正确性。如需处理二进制数据（如图片），可将输入类型改为unsigned char*并配合长度参数使用。

解码

以下是C++实现的Base64字符串解密算法及核心原理说明，结合技术文档和实现要点：

一、Base64解码原理

Base64解码是编码的逆过程，核心步骤包括 4字符转3字节的转换规则：

去除填充符：先移除末尾的=，根据=数量判断原始数据补位情况（0/2/4个补位）
字符映射：将Base64字符转换为6位二进制值（查反向映射表）
位重组：每4个6位值合并为24位数据，再拆分为3个8位字节
补位处理：根据原始补位情况丢弃无效位（每1个=需丢弃最后2位）

二、C++实现代码

#include <string>
#include <vector>

const std::string BASE64_CHARS = 
    "ABCDEFGHIJKLMNOPQRSTUVWXYZ"
    "abcdefghijklmnopqrstuvwxyz"
    "0123456789+/";

std::string base64_decode(const std::string &input) {
    std::vector<int> decode_table(256, -1);
    for (int i = 0; i < 64; i++) {
        decode_table[BASE64_CHARS[i]] = i;
    }

    std::string decoded;
    int val = 0, bits = -8;
    unsigned int len = input.size(); 
    
    for (unsigned char c : input) {
        if (c == '=') break; // 停止处理填充符
        if (decode_table[c] == -1) continue; // 跳过非法字符
        
        val = (val << 6) + decode_table[c]; // 合并6位数据到24位缓冲区
        bits += 6;
        
        if (bits >= 0) { // 每次提取8位生成原始字节
            decoded.push_back((val  >> bits) & 0xFF);
            bits -= 8;
        }
    }
    
    // 处理剩余位（根据=数量判断有效数据）
    if (bits > -8 && (input.back()  != '=' || (len % 4) == 1)) {
        decoded.push_back((val  << 8) >> (bits + 8) & 0xFF);
    }
    
    return decoded;
}

三、关键实现解析

反向映射表构建
使用decode_table将ASCII字符映射到6位值，非法字符返回-1。
位操作重组

val作为24位缓冲区，通过左移6位合并输入字符的6位值
bits记录当前有效位数（-8表示初始需要填充8位）
(val >> bits) & 0xFF提取8位原始数据

边界处理
- 填充符处理：遇到=提前终止循环
- 剩余位计算：根据=数量和输入长度判断有效数据范围

四、使用示例

int main() {
    std::string encoded = "SGVsbG8gV29ybGQh";
    std::string decoded = base64_decode(encoded);
    // 输出：Hello World!
    std::cout << decoded << std::endl; 
    return 0;
}