哈夫曼树【北邮机试】
一、哈夫曼树
机试考察的最多的就是WPL,是围绕其变式展开考察。
哈夫曼树的构建是不断选取集合中最小的两个根节点进行合并,而且在合并过程中排序也会发生变化,因此最好使用优先队列来维护单调性,方便排序和合并。
核心代码如下:
//取出两个权最小的
int num1 = (q.top()).x;
q.pop();
int num2 = (q.top()).x;
q.pop();
//权相加,生成新的节点,并放入队列
node new_node;
new_node.x = num1 + num2;
q.push(new_node);
//结果累加。本来树的带权路径计算是所有节点深度*权的和,但是这里通过
//几层累加,也能实现乘法的效果。在最下面的节点,累加次数最多,即相当于
//乘的数值最大
ans += num1 + num2;
//输出的ans即为最终WPL的值
二、哈夫曼树(北邮机试)
Time Limit: 1000 ms
Memory Limit: 256 mb
哈夫曼树,第一行输入一个数n,表示叶结点的个数。需要用这些叶结点生成哈夫曼树,根据哈夫曼树的概念,这些结点有权值,即weight,题目需要输出所有结点的值与权值的乘积之和。
输入输出格式:
输入格式
输入有多组数据。
每组第一行输入一个数n,接着输入n个叶节点(叶节点权值不超过100,2<=n<=1000)。
输出格式
输出权值。
输入输出样例:
输入样例:
5
1 2 2 5 9
输出样例:
37
AC代码如下:
#include<bits/stdc++.h>
using namespace std;
struct Node {
int x;
Node(int a) {x = a;}//定义一下构造函数
};
//重新定义比较运算符
bool operator < (const Node& a, const Node& b) {
return a.x>b.x;
}
//计算WPL
int getWPL(priority_queue<Node> q) {
int sum = 0;
while(q.size()>1) {//只剩下根节点的时候退出
int num1 = (q.top()).x;
q.pop();
int num2 = (q.top()).x;
q.pop();
Node tmp(num1+num2);
q.push(tmp);
sum += num1+num2;
}
return sum;
}
int main() {
int n;
while(cin>>n){
int a[n];
priority_queue<Node> q;
for(int i=0 ; i<n ; i++) {
cin>>a[i];
Node tmp(a[i]);
q.push(tmp);
}
int sum = getWPL(q);
cout<<sum<<endl;
}
return 0;
}
三、哈夫曼编码
输入输出格式:
输入格式
输入文件将包含文本字符串列表,每行一个。 文本字符串将仅包含大写字母数字字符和下划线(用于代替空格)。 输入结束将通过仅包含单词“ END”作为文本字符串的行来表示。 此行不应被处理。
输出格式
对于输入中的每个文本字符串,输出8位ASCII编码的位长度,最佳无前缀可变长度编码的位长度以及精确到小数点后的压缩率。
输入输出样例:
输入样例:
AAAAABCD
THE_CAT_IN_THE_HAT
END
输出样例:
64 13 4.9
144 51 2.8
分析:这道题目关键在于计算压缩后的长度,本质上也是计算WPL(这里的权值是每个字母出现的次数,路径长度就是编码的长度,一个二进制数就是一位)。
AC代码如下:
#include<bits/stdc++.h>
using namespace std;
string str;
int len, num[30];
int bfs() {
priority_queue<int, vector<int>, greater<int> > q; // 创建优先队列,从小到大排序
for(int i = 0; i < 30; i++) {
if(num[i]) q.push(num[i]); // 放入每个字母的个数
}
int sum = 0;
if(q.size() == 1) sum = q.top(); // 如果只有一个字母,直接等于该字母的数量
while(q.size() > 1) { // 得到前两个最小的叶子节点,将和放入队列中
int a = q.top(); q.pop();
int b = q.top(); q.pop();
sum += (a + b); q.push(a + b); // 因为ans累加了之前的值,所以传入的是a + b而非ans;
}
return sum;
}
int main() {
while(cin >> str) {
memset(num, 0, sizeof num);
if(str == "END") break; // 注意为双引号
len = str.size(); // 得到string类型的长度
for(int i = 0; i < len; i++) {
if(str[i] == '_') num[26]++; // 应为'A' - 'A'等于0,从下标0开始,所以'_'就在num[26]
else num[str[i] - 'A']++;
}
int res = bfs();
printf("%d %d %.1lf\n", len * 8, res, len * 8.0 / res);
}
return 0;
}
四、合并果子(中南大学机试)
Time Limit: 1000 ms
Memory Limit: 256 mb
在一个果园里,多多已经将所有的果子打了下来,而且按果子的不同种类分成了不同的堆。多多决定把所有的果子合成一堆。 每一次合并,多多可以把两堆果子合并到一起,消耗的体力等于两堆果子的重量之和。可以看出,所有的果子经过n-1次合并之后,就只剩下一堆了。多多在合并果子时总共消耗的体力等于每次合并所耗体力之和。 因为还要花大力气把这些果子搬回家,所以多多在合并果子时要尽可能地节省体力。假定每个果子重量都为1,并且已知果子的种类数和每种果子的数目,你的任务是设计出合并的次序方案,使多多耗费的体力最少,并输出这个最小的体力耗费值。 例如有3种果子,数目依次为1,2,9。可以先将1、2堆合并,新堆数目为3,耗费体力为3。接着,将新堆与原先的第三堆合并,又得到新的堆,数目为12,耗费体力为12。所以多多总共耗费体力=3+12=15。可以证明15为最小的体力耗费值。
输入输出格式:
输入格式
输入包括两行,第一行是一个整数n(1<=n<=10000),表示果子的种类数。第二行包含n个整数,用空格分隔,第i个整数ai(1<=ai<=20000)是第i种果子的数目。
输出格式
输出包括一行,这一行只包含一个整数,也就是最小的体力耗费值。输入数据保证这个值小于2^31。
输入输出样例:
输入样例:
3
1 2 9
输出样例:
15
分析:这题本质上还是计算WPL,只是题面比较明显看出在构造哈夫曼树过程中对权值进行累加。
AC代码直接参考【北邮机试】代码,输出ans即可。