当前位置：首页 > article >正文

哈夫曼树【北邮机试】

article 2025/2/21 3:36:10

一、哈夫曼树

机试考察的最多的就是WPL，是围绕其变式展开考察。
在这里插入图片描述
哈夫曼树的构建是不断选取集合中最小的两个根节点进行合并，而且在合并过程中排序也会发生变化，因此最好使用优先队列来维护单调性，方便排序和合并。
核心代码如下：

//取出两个权最小的
int num1 = (q.top()).x;
q.pop();
int num2 = (q.top()).x;
q.pop();
//权相加，生成新的节点，并放入队列
node new_node;
new_node.x = num1 + num2;
q.push(new_node);
//结果累加。本来树的带权路径计算是所有节点深度*权的和，但是这里通过
//几层累加，也能实现乘法的效果。在最下面的节点，累加次数最多，即相当于
//乘的数值最大
ans += num1 + num2;
//输出的ans即为最终WPL的值

二、哈夫曼树（北邮机试）

Time Limit: 1000 ms
Memory Limit: 256 mb
哈夫曼树，第一行输入一个数n，表示叶结点的个数。需要用这些叶结点生成哈夫曼树，根据哈夫曼树的概念，这些结点有权值，即weight，题目需要输出所有结点的值与权值的乘积之和。
输入输出格式：
输入格式

输入有多组数据。
每组第一行输入一个数n，接着输入n个叶节点（叶节点权值不超过100，2<=n<=1000）。

输出格式

输出权值。

输入输出样例：
输入样例：

5  
1 2 2 5 9

输出样例：

AC代码如下：

#include<bits/stdc++.h>
using namespace std;

struct Node {
	int x;
	Node(int a) {x = a;}//定义一下构造函数 
};

//重新定义比较运算符 
bool operator < (const Node& a, const Node& b) {
	return a.x>b.x;
}

//计算WPL
int getWPL(priority_queue<Node> q) {
	int sum = 0;
	while(q.size()>1) {//只剩下根节点的时候退出 
		int num1 = (q.top()).x;
		q.pop();
		int num2 = (q.top()).x;
		q.pop();
		Node tmp(num1+num2);
		q.push(tmp);
		sum += num1+num2; 
	}
	return sum;
}

int main() {
	int n;
	while(cin>>n){
		int a[n];
		priority_queue<Node> q;
		for(int i=0 ; i<n ; i++) {
			cin>>a[i];
			Node tmp(a[i]);
			q.push(tmp);
		}
		int sum = getWPL(q);
		cout<<sum<<endl; 
	}
	return 0;
}

三、哈夫曼编码

输入输出格式：
输入格式

输入文件将包含文本字符串列表，每行一个。文本字符串将仅包含大写字母数字字符和下划线（用于代替空格）。输入结束将通过仅包含单词“ END”作为文本字符串的行来表示。此行不应被处理。

输出格式

对于输入中的每个文本字符串，输出8位ASCII编码的位长度，最佳无前缀可变长度编码的位长度以及精确到小数点后的压缩率。

输入输出样例：
输入样例：

AAAAABCD
THE_CAT_IN_THE_HAT
END

输出样例：

64 13 4.9
144 51 2.8

分析：这道题目关键在于计算压缩后的长度，本质上也是计算WPL（这里的权值是每个字母出现的次数，路径长度就是编码的长度，一个二进制数就是一位）。
AC代码如下：

#include<bits/stdc++.h>
using namespace std;

string str;
int len, num[30];

int bfs() {
	priority_queue<int, vector<int>, greater<int> > q;  // 创建优先队列，从小到大排序
	for(int i = 0; i < 30; i++) {
		if(num[i])	q.push(num[i]);  // 放入每个字母的个数
	}
	int sum = 0;
	if(q.size() == 1)	sum = q.top();  // 如果只有一个字母，直接等于该字母的数量
	while(q.size() > 1) {  // 得到前两个最小的叶子节点，将和放入队列中
		int a = q.top();	q.pop();
		int b = q.top();	q.pop();
		sum += (a + b);	    q.push(a + b);   // 因为ans累加了之前的值，所以传入的是a  + b而非ans;
	}
	return sum;
}

int main() {
	while(cin >> str) {
		memset(num, 0, sizeof num);
		if(str == "END")	break;  // 注意为双引号
		len = str.size();  // 得到string类型的长度
		for(int i = 0; i < len; i++) {
			if(str[i] == '_')	num[26]++;  // 应为'A' - 'A'等于0，从下标0开始，所以'_'就在num[26]
			else	num[str[i] - 'A']++;
		} 
		int res = bfs();
		printf("%d %d %.1lf\n", len * 8, res, len * 8.0 / res);
	}
	return 0;
}

四、合并果子（中南大学机试）

Time Limit: 1000 ms
Memory Limit: 256 mb
在一个果园里，多多已经将所有的果子打了下来，而且按果子的不同种类分成了不同的堆。多多决定把所有的果子合成一堆。每一次合并，多多可以把两堆果子合并到一起，消耗的体力等于两堆果子的重量之和。可以看出，所有的果子经过n-1次合并之后，就只剩下一堆了。多多在合并果子时总共消耗的体力等于每次合并所耗体力之和。因为还要花大力气把这些果子搬回家，所以多多在合并果子时要尽可能地节省体力。假定每个果子重量都为1，并且已知果子的种类数和每种果子的数目，你的任务是设计出合并的次序方案，使多多耗费的体力最少，并输出这个最小的体力耗费值。例如有3种果子，数目依次为1，2，9。可以先将1、2堆合并，新堆数目为3，耗费体力为3。接着，将新堆与原先的第三堆合并，又得到新的堆，数目为12，耗费体力为12。所以多多总共耗费体力=3+12=15。可以证明15为最小的体力耗费值。
输入输出格式：
输入格式