当前位置：首页 > article >正文

蓝桥杯备考：离散化详解

article 2025/3/11 10:57:04

首先，为什么要有离散化呢？

比如这道题，我们应该开一个差分数组，但是a，b之间的间隔可是太大了，难道我们要开一个2的三十二次方大小的数组吗？我们也是开不了这么大的数组的

我们就需要把这些数离散化，映射到一个小于n的数组里面

比如[99,9,9999,999999,99,9]

如果我们要直接映射到一个哈希表上就要开一个10的6次方大小的数组，但是我们不用这么做

这种数据量小但是数据范围大的情况，我们可以把它从小到大依次映射

9就是编号1，99就是编号2，9999就是编号3，999999就是编号4

这种就是叫做我们的离散化

实现我们的离散化有两种方法，一种就是排序+去重+二分

#include <iostream>
#include <algorithm>
using namespace std;
const int N = 1e5 + 10;
int a[N], disc[N];
int n;
int pos;
int find(int x)
{
	int l = 1, r = pos;
	while (l < r)
	{
		int mid = (l + r) / 2;
		if (disc[mid] >= x) r = mid;
		else l = mid + 1;
	}
	return l;
}
int main()
{
	cin >> n;
	for (int i = 1; i <= n; i++)
	{
		cin >> a[i];
		disc[++pos] = a[i];
	}
	sort(disc + 1, disc + 1 + pos);
	pos = (unique(disc + 1, disc + 1 + pos) - (disc + 1));
	for (int i = 1; i <= n; i++)
	{
		cout << a[i] << "离散化后是：" << find(a[i]) << endl;
	}


	return 0;
}

另一种方法就是利用哈希表unordered_map map是双元的，第一个int存原始值，第二个int存离散化之后的值，我们就直接从小到大遍历dict数组，把每个原始值都编上号，重复的不编，然后我们再遍历原数组，通过原始值找对应的编号（这里直接下标访问就行了）

#include <iostream>
#include <unordered_map>
#include <algorithm>
using namespace std;
const int N = 1e5+10;
int n;
int a[N],disc[N];
int main()
{
	int pos = 0;
	cin >> n;
	for(int i =1;i<=n;i++)
	{
		cin >> a[i];
		disc[++pos] = a[i];
	}
	sort(disc+1,disc+1+pos);
	unordered_map <int,int> mp;
	int cnt = 0;
	for(int i = 1;i<=pos;i++)
	{
		int x = disc[i];
		if(mp.count(x)) continue;
		++cnt;
		mp[x] = cnt;
	}
	for(int i= 1;i<=n;i++)
	{
		cout << a[i] << "离散化之后的值:" << mp[a[i]] << endl;
	}
}

我们回到火烧赤壁这道题来，apprently这道题是要用差分做的，但是如果我们直接差分的话，这个区间可以达到最大是2^32 我们是开不了这么大的数组的，所以我们就要用到所谓离散化

我们把每个数都离散化，然后遍历每个区间，用差分数组对离散化后的区间进行整体+1

然后还原差分数组，统计每个区间（这时候区间个数要用原数据来算）

#include <iostream>
#include <unordered_map>
#include <algorithm>
using namespace std;
const int N = 2e4+10;
int a[N],b[N];
int f[N*2],disc[N*2];
unordered_map<int,int> mp;
int n;
int pos;
int main()
{
	cin >> n;
	for(int i = 1;i<=n;i++)
	{
		cin >> a[i] >> b[i];
		disc[++pos] = a[i];
		disc[++pos] = b[i];
	}
	sort(disc+1,disc+1+pos);
	pos = unique(disc+1,disc+1+pos)-(disc+1);
	for(int i =1;i<=pos;i++)
	{
		mp[disc[i]] = i;
	}
	for(int i = 1;i<=n;i++)
	{
		int l = a[i],r = b[i];
		f[mp[l]]+=1;f[mp[r]]-=1;
	}
	for(int i = 1;i<=pos;i++)
	{
		f[i]+=f[i-1]; 
	}
	int ret = 0;
	for(int i = 1;i<=pos;i++)
	{
		int j = i;
		while(f[j]!=0 && j<=pos)
		{
			j++;
		}
		ret+=disc[j]-disc[i];
		i = j+1;
		
	}
	cout << ret << endl;
	return 0;
}

查看全文

http://www.kler.cn/a/579866.html