当前位置: 首页 > article >正文

C/C++ 数据结构与算法【哈夫曼树】 哈夫曼树详细解析【日常学习,考研必备】带图+详细代码

哈夫曼树(最优二叉树)

1)基础概念

**路径:**从树中一个结点到另一个结点之间的分支构成这两个结点间的路径。

**结点的路径长度:**两结点间路径上的分支数。

在这里插入图片描述

**树的路径长度:**从树根到每一个结点的路径长度之和。记作:TL。

在这里插入图片描述

结点数目相同的二叉树中,完全二叉树是路径长度最短的二叉树。

**权:**将树中结点赋给一个有着某种含义的数值,则这个数值称为该结点的权。

**结点的带权路径长度:**从根结点到该结点之间的路径长度与该结点的权的乘积。

**树的带权路径长度:**树中所有叶子结点的带权路径长度之和。

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

2)构造哈夫曼树

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

顺序存储结构——一维结构数组

(1)定义结构

在这里插入图片描述

typedef struct {
	int weight; 
	int parent, lch, rch;
}HTNode, * HuffmanTree;

HuffmanTree H;
(2)步骤:

在这里插入图片描述
在这里插入图片描述

  1. 初始化HT [1…2n-1]:lch = rch = parent = 0;
  2. 输入初始几个叶子结点:置HT[1…n]的 weight 值;
  3. 进行以下n-1次合并,依次产生n-1个结点HT[i],i = n + 1…2n-1:
    • 在HT[1…i-1]中选两个未被选过(从parent ==0 的结点中选)的weight最小的两个结点 HT[S1] 和 HT[S2],s1、s2为两个最小结点下标;
    • 修改 HT[s1] 和 HT[s2] 的parent值:HT[s1].parent = i; HT[s2] .parent = i;
    • 修改新产生的HT[i]:
HT[i].weight = HT[s1].weight + HT[s2].weight;
HTli].Ich = s1; 
HT[i].rch = s2;
void CreatHuffmanTree(HuffmanTree& HT, int n) { //构造哈夫曼树--哈夫曼算法
    if (n <= 1) return;

    int m = 2 * n - 1; // 数组共2n-1个元素
    HT = new HTNode[m + 1]; // 动态分配内存,0号单元未用,HT[m]表示根结点

    // 初始化2n-1个元素的lch、rch、parent为0
    for (int i = 1; i <= m; ++i) {
        HT[i].lch = HT[i].rch = HT[i].parent = 0;
    }

    // 输入前n个元素的weight值
    cout << "请输入" << n << "个字符的频率:" << endl;
    for (int i = 1; i <= n; ++i) {
        cin >> HT[i].weight;
    }

    // 构建哈夫曼树
    for (int i = n + 1; i <= m; i++) {
        int s1, s2;
        Select(HT, i - 1, s1, s2);

        HT[s1].parent = i;
        HT[s2].parent = i;

        HT[i].lch = s1;
        HT[i].rch = s2;
        HT[i].weight = HT[s1].weight + HT[s2].weight;
    }
}
(3)总代码:
权值为整数:
#include <iostream>
#include <limits.h>

using namespace std;

// 定义哈夫曼树节点结构
typedef struct {
    int weight;
    int parent, lch, rch;
} HTNode;

typedef HTNode* HuffmanTree;

// 选择两个双亲域为0且权值最小的结点
void Select(const HTNode* HT, int i, int& s1, int& s2) {
    s1 = s2 = -1;
    int min1 = INT_MAX, min2 = INT_MAX;

    for (int j = 1; j <= i; ++j) {
        if (HT[j].parent == 0 && HT[j].weight < min1) {
            min2 = min1;
            s2 = s1;
            min1 = HT[j].weight;
            s1 = j;
        }
        else if (HT[j].parent == 0 && HT[j].weight < min2) {
            min2 = HT[j].weight;
            s2 = j;
        }
    }
}

void CreatHuffmanTree(HuffmanTree& HT, int n) { //构造哈夫曼树--哈夫曼算法
    if (n <= 1) return;

    int m = 2 * n - 1; // 数组共2n-1个元素
    HT = new HTNode[m + 1]; // 动态分配内存,0号单元未用,HT[m]表示根结点

    // 初始化2n-1个元素的lch、rch、parent为0
    for (int i = 1; i <= m; ++i) {
        HT[i].lch = HT[i].rch = HT[i].parent = 0;
    }

    // 输入前n个元素的weight值
    cout << "请输入" << n << "个字符的频率:" << endl;
    for (int i = 1; i <= n; ++i) {
        cin >> HT[i].weight;
    }

    // 构建哈夫曼树
    for (int i = n + 1; i <= m; i++) {
        int s1, s2;
        Select(HT, i - 1, s1, s2);

        HT[s1].parent = i;
        HT[s2].parent = i;

        HT[i].lch = s1;
        HT[i].rch = s2;
        HT[i].weight = HT[s1].weight + HT[s2].weight;
    }
}

int main() {
    int n;
    cout << "请输入叶子节点的数量:";
    cin >> n;

    HuffmanTree HT;
    CreatHuffmanTree(HT, n);

    // 打印哈夫曼树(示例)
    cout << "哈夫曼树构造完成,打印结果如下:" << endl;
    for (int i = 1; i < 2 * n; ++i) {
        cout << "Node " << i << ": Weight=" << HT[i].weight
            << ", Parent=" << HT[i].parent
            << ", Left Child=" << HT[i].lch
            << ", Right Child=" << HT[i].rch << endl;
    }

    delete[] HT; // 释放动态分配的内存
    return 0;
}
权值为浮点数
#include <iostream>
#include <limits.h> // 如果不再使用 INT_MAX,可以不需要这个头文件

using namespace std;

// 定义哈夫曼树节点结构,将 weight 改为 double 类型
typedef struct {
    double weight;  // 权值改为 double 类型
    int parent, lch, rch;
} HTNode;

typedef HTNode* HuffmanTree;

// 选择两个双亲域为0且权值最小的结点
void Select(const HTNode* HT, int i, int& s1, int& s2) {
    s1 = s2 = -1;
    double min1 = DBL_MAX, min2 = DBL_MAX; // 使用 DBL_MAX 作为最大值初始化

    for (int j = 1; j <= i; ++j) {
        if (HT[j].parent == 0 && HT[j].weight < min1) {
            min2 = min1;
            s2 = s1;
            min1 = HT[j].weight;
            s1 = j;
        }
        else if (HT[j].parent == 0 && HT[j].weight < min2) {
            min2 = HT[j].weight;
            s2 = j;
        }
    }
}

void CreatHuffmanTree(HuffmanTree& HT, int n) { //构造哈夫曼树--哈夫曼算法
    if (n <= 1) return;

    int m = 2 * n - 1; // 数组共2n-1个元素
    HT = new HTNode[m + 1]; // 动态分配内存,0号单元未用,HT[m]表示根结点

    // 初始化2n-1个元素的lch、rch、parent为0
    for (int i = 1; i <= m; ++i) {
        HT[i].lch = HT[i].rch = HT[i].parent = 0;
        HT[i].weight = 0.0; // 初始化 weight 为 0.0
    }

    // 输入前n个元素的weight值
    cout << "请输入" << n << "个字符的小数频率:" << endl;
    for (int i = 1; i <= n; ++i) {
        cin >> HT[i].weight;
    }

    // 构建哈夫曼树
    for (int i = n + 1; i <= m; i++) {
        int s1, s2;
        Select(HT, i - 1, s1, s2);

        HT[s1].parent = i;
        HT[s2].parent = i;

        HT[i].lch = s1;
        HT[i].rch = s2;
        HT[i].weight = HT[s1].weight + HT[s2].weight;
    }
}

int main() {
    int n;
    cout << "请输入叶子节点的数量:";
    cin >> n;

    HuffmanTree HT;
    CreatHuffmanTree(HT, n);

    // 打印哈夫曼树(示例)
    cout << "哈夫曼树构造完成,打印结果如下:" << endl;
    for (int i = 1; i <= 2 * n - 1; ++i) { // 注意这里应该是 2*n-1 而不是 2*n
        cout << "Node " << i << ": Weight=" << HT[i].weight
            << ", Parent=" << HT[i].parent
            << ", Left Child=" << HT[i].lch
            << ", Right Child=" << HT[i].rch << endl;
    }

    delete[] HT; // 释放动态分配的内存
    return 0;
}
(4)运行结果:

在这里插入图片描述

3)哈夫曼编码

在远程通讯中,要将待传字符转换成由二进制的字符串:
在这里插入图片描述

若将编码设计为长度不等的二进制编码,即让待传字符串中出现次数较多的字符采用尽可能短的编码,则转换的二进制字符串便可能减少。
在这里插入图片描述

问题1 :什么样的前缀码能使得电文总长最短?

——哈夫曼编码

方法:

1、统计字符集中每个字符在电文中出现的平均概率(概率越大要求编码越短)。

2、利用哈夫曼树的特点:权越大的叶子离根越近;将每个字符的概率值作为权值,构造哈夫曼树。 则概率越大的结点,路径越短。

3、在哈夫曼树的每个分支上标上0或1:

  • 结点的左分支标0,右分支桥 1。
  • 把从根到每个吐子的路径上的标号连接起来,作为该叶子代表的字符的编码。

在这里插入图片描述

问题2 :为什么哈夫曼编码能够保证是前缀编码?

因为没有一片树叶是另一片树叶的祖先,所以每个叶结点的编码就不可能是其它叶结点编码的前缀。

问题 3 :为什么哈夫曼编码能够保证字符编码总长最短?

因为哈夫曼树的带权路径长度最短,故字符编码的总长最短。

  • 性质1 哈夫曼编码是前缀码
  • 性质2 哈夫曼编码是最优前缀码
算法实现:
// 从叶子到根逆向求每个字符的哈夫曼编码,存储在编码表HC中
void CreatHuffmanCode(const HuffmanTree& HT, HuffmanCode& HC, int n) {
    HC = new char*[n + 1]; // 分配n个字符编码的头指针数组
    char* cd = new char[n]; // 分配临时存放编码的动态数组空间
    cd[n - 1] = '\0'; // 编码结束符

    for (int i = 1; i <= n; ++i) {
        int start = n - 1;
        int c = i;
        int f = HT[i].parent;

        // 从叶子结点开始向上回溯,直到根结点
        while (f != 0) {
            --start;
            if (HT[f].lch == c)
                cd[start] = '0'; // 结点c是f的左孩子,则生成代码0
            else
                cd[start] = '1'; // 结点c是f的右孩子,则生成代码1

            c = f;
            f = HT[f].parent;
        }

        // 计算编码长度并分配适当的空间
        int codeLength = n - start;
        HC[i] = new char[codeLength];
        strncpy(HC[i], &cd[start], codeLength);
        HC[i][codeLength - 1] = '\0'; // 确保字符串以空字符终止
    }

    delete[] cd; // 释放临时空间
}

strncpy(HC[i], &cd[start], codeLength);语句在C++中确实可以用于复制字符数组,但它有一些潜在的问题和局限性。特别是当你使用strncpy时,如果目标缓冲区没有足够的空间来包含源字符串加上终止空字符(\0),它不会自动添加终止空字符,这可能会导致后续操作出现问题。

此外,在现代C++中,更推荐使用std::string来处理字符串,因为它们更安全、更方便,并且可以避免手动管理内存的复杂性和风险。

// 从叶子到根逆向求每个字符的哈夫曼编码,存储在编码表HC中
void CreatHuffmanCode(const HuffmanTree& HT, HuffmanCode& HC, int n) {
    HC.resize(n + 1); // 分配n个字符编码的空间

    for (int i = 1; i <= n; ++i) {
        string code = "";
        int c = i;
        int f = HT[i].parent;

        // 从叶子结点开始向上回溯,直到根结点
        while (f != 0) {
            if (HT[f].lch == c)
                code = '0' + code; // 结点c是f的左孩子,则生成代码0
            else
                code = '1' + code; // 结点c是f的右孩子,则生成代码1

            c = f;
            f = HT[f].parent;
        }

        HC[i] = code;
    }
}
总代码实现:

在这里插入图片描述

#include <iostream>
#include <cstring> // 用于 strcpy 和 strlen
#include <limits>  // 用于 std::numeric_limits

using namespace std;

// 定义哈夫曼树节点结构
typedef struct HTNode {
    double weight; // 权重改为 double 类型
    int parent, lch, rch;
} HTNode;

typedef HTNode* HuffmanTree;

// 定义哈夫曼编码结构
typedef char** HuffmanCode;

// 选择两个双亲域为0且权值最小的结点
void Select(const HTNode* HT, int i, int& s1, int& s2) {
    s1 = s2 = -1;
    double min1 = numeric_limits<double>::max(), min2 = numeric_limits<double>::max();

    for (int j = 1; j <= i; ++j) {
        if (HT[j].parent == 0 && HT[j].weight < min1) {
            min2 = min1;
            s2 = s1;
            min1 = HT[j].weight;
            s1 = j;
        } else if (HT[j].parent == 0 && HT[j].weight < min2) {
            min2 = HT[j].weight;
            s2 = j;
        }
    }
}

// 构造哈夫曼树--哈夫曼算法
void CreatHuffmanTree(HuffmanTree &HT, int n) {
    if (n <= 1) return;

    int m = 2 * n - 1; // 数组共2n-1个元素
    HT = new HTNode[m + 1]; // 动态分配内存,0号单元未用,HT[m]表示根结点

    // 初始化2n-1个元素的lch、rch、parent为0
    for (int i = 1; i <= m; ++i) {
        HT[i].lch = HT[i].rch = HT[i].parent = 0;
        HT[i].weight = 0.0; // 初始化权重为 0.0
    }

    // 输入前n个元素的weight值
    cout << "请输入" << n << "个字符的频率(浮点数):" << endl;
    for (int i = 1; i <= n; ++i) {
        cin >> HT[i].weight;
    }

    // 构建哈夫曼树
    for (int i = n + 1; i <= m; i++) {
        int s1, s2;
        Select(HT, i - 1, s1, s2);

        HT[s1].parent = i;
        HT[s2].parent = i;

        HT[i].lch = s1;
        HT[i].rch = s2;
        HT[i].weight = HT[s1].weight + HT[s2].weight;
    }
}

// 从叶子到根逆向求每个字符的哈夫曼编码,存储在编码表HC中
void CreatHuffmanCode(HuffmanTree HT, HuffmanCode& HC, int n) {
    HC = new char*[n + 1]; // 分配n个字符编码的头指针数组
    char* cd = new char[n]; // 分配临时存放编码的动态数组空间
    cd[n - 1] = '\0'; // 编码结束符

    for (int i = 1; i <= n; ++i) {
        int start = n - 1;
        int c = i;
        int f = HT[i].parent;

        // 从叶子结点开始向上回溯,直到根结点
        while (f != 0) {
            --start;
            if (HT[f].lch == c)
                cd[start] = '0'; // 结点c是f的左孩子,则生成代码0
            else
                cd[start] = '1'; // 结点c是f的右孩子,则生成代码1

            c = f;
            f = HT[f].parent;
        }

        // 计算编码长度并分配适当的空间
        int codeLength = n - start;
        HC[i] = new char[codeLength];
        strncpy(HC[i], &cd[start], codeLength);
        HC[i][codeLength - 1] = '\0'; // 确保字符串以空字符终止
    }

    delete[] cd; // 释放临时空间
}

// 测试函数
int main() {
    int n;
    cout << "请输入叶子节点的数量:";
    cin >> n;

    HuffmanTree HT;
    CreatHuffmanTree(HT, n);

    HuffmanCode HC;
    CreatHuffmanCode(HT, HC, n);

    // 打印哈夫曼编码
    cout << "哈夫曼编码如下:" << endl;
    for (int i = 1; i <= n; ++i) {
        cout << "Character " << i << ": " << HC[i] << endl;
    }

    // 清理资源
    for (int i = 1; i <= n; ++i) {
        delete[] HC[i];
    }
    delete[] HC;
    delete[] HT;

    return 0;
}

改进后的代码:

#include <iostream>
#include <vector>
#include <string>
#include <limits>

using namespace std;

// 定义哈夫曼树节点结构
typedef struct HTNode {
    double weight; // 权重改为 double 类型
    int parent, lch, rch;
} HTNode;

typedef HTNode* HuffmanTree;

// 选择两个双亲域为0且权值最小的结点
void Select(const vector<HTNode>& HT, int i, int& s1, int& s2) {
    s1 = s2 = -1;
    double min1 = numeric_limits<double>::max(), min2 = numeric_limits<double>::max();

    for (int j = 1; j <= i; ++j) {
        if (HT[j].parent == 0 && HT[j].weight < min1) {
            min2 = min1;
            s2 = s1;
            min1 = HT[j].weight;
            s1 = j;
        } else if (HT[j].parent == 0 && HT[j].weight < min2) {
            min2 = HT[j].weight;
            s2 = j;
        }
    }
}

// 构造哈夫曼树--哈夫曼算法
void CreatHuffmanTree(vector<HTNode>& HT, int n) {
    if (n <= 1) return;

    int m = 2 * n - 1; // 数组共2n-1个元素

    // 初始化2n-1个元素的lch、rch、parent为0,权重为0.0
    HT.resize(m + 1);
    for (int i = 1; i <= m; ++i) {
        HT[i] = {0.0, 0, 0, 0};
    }

    // 输入前n个元素的weight值
    cout << "请输入" << n << "个字符的频率(浮点数):" << endl;
    for (int i = 1; i <= n; ++i) {
        cin >> HT[i].weight;
    }

    // 构建哈夫曼树
    for (int i = n + 1; i <= m; i++) {
        int s1, s2;
        Select(HT, i - 1, s1, s2);

        HT[s1].parent = i;
        HT[s2].parent = i;

        HT[i].lch = s1;
        HT[i].rch = s2;
        HT[i].weight = HT[s1].weight + HT[s2].weight;
    }
}

// 从叶子到根逆向求每个字符的哈夫曼编码,存储在编码表HC中
void CreatHuffmanCode(const vector<HTNode>& HT, vector<string>& HC, int n) {
    HC.resize(n + 1); // 分配n个字符编码的空间

    for (int i = 1; i <= n; ++i) {
        string code = "";
        int c = i;
        int f = HT[i].parent;

        // 从叶子结点开始向上回溯,直到根结点
        while (f != 0) {
            if (HT[f].lch == c)
                code = '0' + code; // 结点c是f的左孩子,则生成代码0
            else
                code = '1' + code; // 结点c是f的右孩子,则生成代码1

            c = f;
            f = HT[f].parent;
        }

        HC[i] = code;
    }
}

// 测试函数
int main() {
    int n;
    cout << "请输入叶子节点的数量:";
    cin >> n;

    vector<HTNode> HT;
    CreatHuffmanTree(HT, n);

    vector<string> HC;
    CreatHuffmanCode(HT, HC, n);

    // 打印哈夫曼编码
    cout << "哈夫曼编码如下:" << endl;
    for (int i = 1; i <= n; ++i) {
        cout << "Character " << i << ": " << HC[i] << endl;
    }

    return 0;
}

改进后:

#include <iostream>
#include <cstring> // 用于 strcpy 和 strlen
#include <limits>  // 用于 std::numeric_limits

using namespace std;

// 定义哈夫曼树节点结构
typedef struct HTNode {
    double weight; // 权重改为 double 类型
    int parent, lch, rch;
} HTNode;

typedef HTNode* HuffmanTree;

// 定义哈夫曼编码结构
typedef char** HuffmanCode;

// 选择两个双亲域为0且权值最小的结点
void Select(const HTNode* HT, int i, int& s1, int& s2) {
    s1 = s2 = -1;
    double min1 = numeric_limits<double>::max(), min2 = numeric_limits<double>::max();

    for (int j = 1; j <= i; ++j) {
        if (HT[j].parent == 0 && HT[j].weight < min1) {
            min2 = min1;
            s2 = s1;
            min1 = HT[j].weight;
            s1 = j;
        } else if (HT[j].parent == 0 && HT[j].weight < min2) {
            min2 = HT[j].weight;
            s2 = j;
        }
    }
}

// 构造哈夫曼树--哈夫曼算法
void CreatHuffmanTree(HuffmanTree &HT, int n) {
    if (n <= 1) return;

    int m = 2 * n - 1; // 数组共2n-1个元素
    HT = new HTNode[m + 1]; // 动态分配内存,0号单元未用,HT[m]表示根结点

    // 初始化2n-1个元素的lch、rch、parent为0
    for (int i = 1; i <= m; ++i) {
        HT[i].lch = HT[i].rch = HT[i].parent = 0;
        HT[i].weight = 0.0; // 初始化权重为 0.0
    }

    // 输入前n个元素的weight值
    cout << "请输入" << n << "个字符的频率):" << endl;
    for (int i = 1; i <= n; ++i) {
        cin >> HT[i].weight;
    }

    // 构建哈夫曼树
    for (int i = n + 1; i <= m; i++) {
        int s1, s2;
        Select(HT, i - 1, s1, s2);

        HT[s1].parent = i;
        HT[s2].parent = i;

        HT[i].lch = s1;
        HT[i].rch = s2;
        HT[i].weight = HT[s1].weight + HT[s2].weight;
    }
}

// 从叶子到根逆向求每个字符的哈夫曼编码,存储在编码表HC中
void CreatHuffmanCode(HuffmanTree HT, HuffmanCode& HC, int n) {
    HC = new char*[n + 1]; // 分配n个字符编码的头指针数组

    for (int i = 1; i <= n; ++i) {
        string code = ""; // 使用string来构建编码
        int c = i;
        int f = HT[i].parent;

        // 从叶子结点开始向上回溯,直到根结点
        while (f != 0) {
            if (HT[f].lch == c)
                code = '0' + code; // 结点c是f的左孩子,则生成代码0
            else
                code = '1' + code; // 结点c是f的右孩子,则生成代码1

            c = f;
            f = HT[f].parent;
        }

        // 将string转换为C风格字符串并分配适当的空间
        HC[i] = new char[code.length() + 1];
        strcpy(HC[i], code.c_str());
    }
}

// 测试函数
int main() {
    int n;
    cout << "请输入叶子节点的数量:";
    cin >> n;

    if (n <= 0) {
        cerr << "叶子节点数量必须大于0." << endl;
        return 1;
    }

    HuffmanTree HT;
    CreatHuffmanTree(HT, n);

    HuffmanCode HC;
    CreatHuffmanCode(HT, HC, n);

    // 打印哈夫曼编码
    cout << "哈夫曼编码如下:" << endl;
    for (int i = 1; i <= n; ++i) {
        cout << "Character " << i << ": " << HC[i] << endl;
    }

    // 清理资源
    for (int i = 1; i <= n; ++i) {
        delete[] HC[i];
    }
    delete[] HC;
    delete[] HT;

    return 0;
}
运行结果:

在这里插入图片描述


http://www.kler.cn/a/460228.html

相关文章:

  • 出现 Error during query execution: StatementCallback; bad SQL grammar 解决方法
  • C#二维数组详解
  • JavaWeb开发(五)Servlet-ServletContext
  • Ubuntu执行sudo apt-get update失败的解决方法
  • 常见的 Redis 面试题
  • Nginx 配置文件详解(带示例)
  • 傲雷亮相2024中国时尚体育季(珠海站),展现户外移动照明风采
  • 什么是Path PDF?
  • 【开源免费】基于SpringBoot+Vue.JS大型商场应急预案管理系统(JAVA毕业设计)
  • PyCharm安装激活教程(Jetbrains其它软件可参考)
  • Linux -- 单例模式
  • 本地小主机安装HomeAssistant开源智能家居平台打造个人AI管家
  • 国产数据库-崖山使用介绍
  • 【视觉SLAM:八、后端Ⅰ】
  • C语言插入排序及其优化
  • 微服务のGeteWay
  • iPhone修复技巧|iPhone异常问题的常用修复方法
  • Excel文件恢复教程:快速找回丢失数据!
  • 位运算与操作符应用
  • Element plus 的 upload 组件实现自定义上传
  • 为什么要用ZGC
  • rocketmq5源码系列--(二)--生产者发送消息
  • Java基础(五): 案例练习;
  • 2024年度AI与科技突破:量子计算引领创新浪潮
  • 实战设计模式之策略模式
  • 操作系统(26)数据一致性控制