C语言练习题之 数组中出现次数超过一半的数
题目描述
给一个长度为 n 的数组,数组中有一个数字出现的次数超过数组长度的一半,请找出这个数字。
例如输入一个长度为9的数组[1,2,3,2,2,2,5,4,2]。由于数字2在数组中出现了5次,超过数组长度的一半,因此输出2。
数据范围:n≤50000,数组中元素的值0≤val≤10000
要求:空间复杂度:O(1),时间复杂度O(n)
输入描述:
保证数组输入非空,且保证有解
示例1
输入:[1,2,3,2,2,2,5,4,2]
返回值:2
示例2
输入:[3,3,3,3,2,2,2]
返回值:3
示例3
输入:[1]
返回值:1
分析如下:
题目意思比较明确,就是要找出数组中的一个数字,这个数字在数组中出现次数超过数组长度的一半。
而题目提供的数组长度是≤50000,数组中元素的取值是 0 - 10000。
基于这些信息,很容易从循环的角度出发,对数组每个数字进行循环统计。
代码如下:
//循环法查找
int find(int arr[], int sz)
{
if (sz == 0) //如果数组内没有元素,则返回-1。
return -1;
int i = 0;
int j = 0;
for (i = 0; i < sz; i++) //遍历数组,每个数都查一遍
{
int count = 0;
for (j = 0; j < sz; j++) //数组中每个数与数组中其余数遍历一遍
{
if (arr[j] == arr[i] && i!= j) //遍历过程中,与第i个数值相同,则计数+1,
{
count++;
}
if (count > sz / 2) //当计数大于数组一半时,返回该数值。
return arr[i];
}
}
}
可以看到,循环法做起来很简单。但题目要求空间复杂度:O(1),时间复杂度O(n)。空间复杂度:O(1),即占用的内存空间不以数据量的变化而变化,无论多少数据,函数占用的内存是固定的;时间复杂度O(n),即花费的时间与数组元素成正比。
上述解法中,空间复杂度满足,时间复杂度不满足,所以需要改进。之前我们介绍过用空间换时间的思路,即将所有可能的情况都列举出来,这里可以用一样的思路。
根据题意,所求的返回值一定是 0-10000 这10001个数中的一个,所以如果提供一个容量为10001的数组,就可以把所求值的所有情况包含进去。然后遍历一遍即可。
代码如下:
int find(int arr[], int sz)
{
if (sz == 0) //如果数组内没有元素,则返回-1。
return -1;
int i = 0;
int j = 0;
int count[10001] = { 0 };
//题目中数组arr的取值范围是0-10000,则满足条件的数一定在这10001个数中
//建立一个数组,包含10001个元素,对应arr数组中可能出现的10001种数值
for (i = 0; i < sz; i++) //遍历数组,对每种元素进行统计
count[arr[i]]++; //对arr数组中每种数值计数
//如果arr数组中1出现了10次,则count[1]就是10;
//5出现1000次,则count[5]就是1000;
//假设n出现次数超出arr数组元素数一半,则n就是要找的值,即count[n] > sz/2
for (i = 0; i < 10001; i++) //遍历count数组
{
if (count[i] > sz / 2) //找出满足条件的n
return i; //返回该值
}
}
这个思路可以算是穷举法。遍历过程中,arr数组中出现哪个数值,就对计数数组的对应位元素+1,统计出arr数组中每个数出现的个数,然后对技术数组遍历一遍,就能找到出现次数超过一半的数字了。
这里空间复杂度是固定值,满足条件,时间复杂度是n+10001,也满足条件。但是占用空间过大,时间也较长,不符合实际,所以我们需要再优化。
根据题意,所求的值 a 在数组中出现的次数一定是大于一半的。也就是说,如果对数组中的元素进行遍历,与 a 相同的数量减去与 a 不同的数量,结果一定大于0。
那么我们假设一个 a ,从第一个数开始计算,与 a 相同则计数+1,不同则计数-1。若 a 是所求值,则最终结果大于0,返回 a;若 a 不是所求值,则将可能值赋给 a,继续计数,找到统计结果大于0的,就是所求值。
代码如下:
//优化解法
//前述解法占用内存空间太大,满足题目要求,但不符合实际。对其进行优化
//根据题意可以想到,返回值出现的次数比其余所有值出现的次数总和都多
//那么对数组元素进行计数,与返回值相同则数值+1,不同则数值-1
//因为返回值占总数一半以上,所以最后统计的数值一定大于0
//基于这个思路,从第一个元素开始计数,后一个元素与其不相等,则计数-1;相等则计数+1;
//当计数小于0时,则更换为新元素
//由于返回值占总数一半以上,所以其统计值最终必然大于0
int find(int* arr, int sz)
{
if (sz == 0) //如果数组内没有元素,则返回-1。
return -1;
int i = 0;
int count = 0;
int a = arr[0]; //初始参考值设为数组第一个元素
for (i = 0; i < sz; i++) //遍历一遍,进行计数
{
if (arr[i] == a) //第i个元素与参考值相同则计数+1
count++;
else //第i个元素与参考值不相同时分项处理
{
if (count > 0) //当之前计数大于0,则计数-1
count--;
else //当之前计数为0,则将arr[i]赋值给参考值a,并计数为1
{
a = arr[i];
count = 1;
}
}
}
return a; //返回参考值
}
//可以看到,上述解法中,每个数值会统计一次,假设所求值是n
//参考值为n时,比较值为n, + 1,比较值为其他数, - 1;最后大于0
//参考值不为n时,比较值为n, - 1,比较值为其他数, + 1或 - 1;最后小于0,变为n,大于0
//占用内存少,且时间复杂度为O(n),满足题目要求
可以看到,如果参考值是所求值 a,比较结束,最后结果大于0。如果参考值不是所求值 a,会被赋新值,因为所求值出现的总数最高,则遍历之后,最后 a一定会被赋值为所求值,比较结束后,结果也一定大于0。而大于0作为判断条件,就可以筛选出正确结果。
这种解法的空间复杂度是固定值,且比较小,时间复杂度为n,满足题意。
此方法细想容易绕晕,只要抓住核心,所求值 a 的数量占总数一半以上,就比较好理解了。以此核心为基础,在其为参考值时进行加法运算,其他数为参考值时进行减法运算,即可求得结果。