整型溢出问题及解决之道
【题目描述】
例题2-2 3n+1问题
猜想:对于任意大于1的自然数n,若n为奇数,则将n变为3n+1,否则变为n的一半。
经过若干次这样的变换,一定会使n变为1。例如,3→10→5→16→8→4→2→1。
输入n,输出变换的次数。。
【样例输入】
3
【样例输出】
7
【题目来源】
刘汝佳《算法竞赛入门经典 第2版》 例题2-2 3n+1问题
【解析】
这道题看似非常简单(老金当初也是这么认为),但却非常容易出错,而且有些细节问题也值得说说。
首先要说的一点是,本题用while循环比用for循环更方便。因为相比for循环,while循环在下面两种情况下更方便:
①循环的次数不确定。
②不是遍历式循环。也就是不像for循环那样用i++遍历某一数据范围。
本题求的就是循环次数,因此是不确定的,而且也没有遍历要求,故而用while更方便。
一、对比,然后知自身之差距也
老金的代码:
int main(){
int n, i=0;
scanf("%d", &n);
while(n!=1) {
if(n%2 != 0) {
n = 3*n + 1;
i++;
}
else{
n = n/2;
i++;
}
}
printf("%d\n", i);
return 0;
}
书中的最初代码:
#include<stdio.h>
int main()
{
int n, count = 0;
scanf("%d", &n);
while(n > 1)
{
if(n % 2 == 1) n = n*3+1;
else n /= 2;
count++;
}
printf("%d\n", count);
return 0;
}
先不论对错,单是对比两段代码,就可找出一些和书中代码的差距:
①我把统计“变换的次数”的语句i++放在了每个分支语句中,而没有放在循环体内,导致代码重复,单这一点就被甩出一条街。
②这个用于统计“变换的次数”的i++在编程中有一个专门的名称:计数器。计数器是用来统计事件发生的次数的,显然书中用的变量名count比老金的更具可读性。
③while循环条件书中用的是n > 1,我的代码用的是n!=1。咋一看貌似老金的代码更符合题目要求。因为题目要求输出由n变为1的次数,而不是n变为≤1的次数。但是别忘了算法竞赛评定的是结果,而不是过程。只要输出结果是对的,它才不会过问你用的是什么判断条件。如果你看完下面要说的代码bug,就会明白书中为什么会用这个判断条件了。
二、乘法溢出
1、代码bug及原因
测试一下上面的两段代码,输入“987654321”,书中代码会输出结果:1,而老金的代码却什么也不会输出。
发生了什么?
如果想不出原因,就需要进行调试,或者用更简单通用的方法:输出中间结果。
只需要在循环体的最后增加一条输出语句printf("%d\n",n),就会将很快找到问题的所在:
①老金代码:屏幕一直在闪,输出的都是负数,程序进入死循环,因而最终什么也不会输出。
②书中的代码:第一次输出为-1332004332,它不大于1,所以循环终止。循环只执行了一次,因而输出1。
现在你明白while循环条件为什么用n>1而不用n!=1了吧,就是为了实现一旦出现bug致使n<1程序也能正常输出(只不过要让人一眼就能看出输出结果是错误的,如本程序中输出1)。
这就是程序的健壮性。
为什么n会出现负值呢?因为乘法溢出了。
老金当初也注意到数据范围的要求,之前也写文章给出算int型数据范围大小的方法,int型最大值为2147483647,看到这个不等式老金就想当然时认定int型可以满足,却没有想到计算过程中3*n会将n的值放大3倍从而导致溢出。
变量、变量,它是一个变化的量,可我在确定数据类型时在潜意识中把它当成了常量。
所以,一定要注意,不仅要满足输入的数值在要求的范围内,计算过程中也不能有任何数值超限。尤其计算过程伴有加法、乘法的情况,要特别小心。
2.修正后的代码
知道问题出在哪,解决起来就简单了,只需改用比int更大的整数类型long long,其范围是。但是记得输入、输出时都要改成“%lld”(还可以用%I64d,I代表Integer,64代表64位)。所以只要把上面书中代码变量n的类型改为long long型,然后将“%d”改为“%lld”即可。
老金实际测试,用%lld、%I64d两种写法都可以,不过按《算法竞赛入门经典》中的说法,long long在Linux下的输入输出格式符为%lld,但Windows平台中有时为%I64d。所以为保险起见,可以改用C++的cin、cout,如果非要用scanf和printf,最好避开这种写法,于是书中给出如下迂回代码:
#include<stdio.h>
int main()
{
int n2, count = 0;
scanf("%d", &n2);
long long n = n2;
while(n > 1)
{
if(n % 2 == 1) n = n*3+1;
else n /= 2;
count++;
}
printf("%d\n", count);
return 0;
}
3.书中迂回代码的不足
上述迂回代码,通过增加一个int中间变量n2将球传给long long。但其实这种写法是有一些问题的。
(1) 对于本题来讲,这种中间变量是没有必要的。
上面的代码可去掉中间变量n2,直接改写成:
#include<stdio.h>
int main()
{
int count = 0;
long long n;
scanf("%d", &n);
while(n > 1)
{
if(n % 2 == 1) n = n*3+1;
else n /= 2;
count++;
}
printf("%d\n", count);
return 0;
}
改后的代码与原代码执行结果完全一样。这段代码的scanf语句竟然使用%d来读取一个long long类型的变量。
这其实没什么不可以。
咱们要明白%d的实质,就是按照int型的大小来读取输入,我们可以将它读取到的数据存储到int型变量中,也完全可以存储到long long型中。
这样做有一个前提,就是输入数据要在int型范围内,否则就会出现溢出错误。
本题要求输入数据, int型完全满足,故此上述代码无问题。
要补充一点,刚刚说的前提“输入数据要在int型范围内”这种表述其实是不准确的,int型能表示的最大数为(即2147483647),实际上是可以超出这个范围的,因为%d是按32位读取的,它可以读取的最大数为(即4294967295),感兴趣的可以测试一下。
(2) 迂回代码存在潜在的数据超限问题。
如果本题要求输入数据,那么上面书中的迂回代码和老金改后代码都会出现数据超限问题。比如输入9876543212,虽然代码都使用了long long型存储变量,但是因为数据已经超出%d的读取范围了,所以读取时只会截取输入数据的前32位(二进制),后面的会被舍去,然后把这个截取后的值存到long long变量。
这时这个long long型变量实际上起了反作用,因为它的存在,数据超限问题被隐藏了,程序能够正常输出,只是结果不对。这样的错误很难发现。比如当输入9876543212时,输出结果201,而正确答案其实是261。
4.正确的方法
根据以上讨论,最后总结一下针对int型数据超限问题的正确处理方法。
首先要把int型变量改为long long型,可以选择以下方式输出。
方法1:使用C++的cin、cout语句进行输入输出。
方法2:在算法竞赛中,如果使用scanf、printf语句输入输出,要用%lld,而不用%I64d。因为前者更具通用性。
方法3:尽量不要用%d输入,除非能保证输入数据不超过(即4294967295)。
此外,还要再次提醒一下要注意确认运算过程中是否可能出现溢出。或者可以换个思路,既然出现大数时int型容易溢出,那在算法竞赛中看到数据范围很大时,不管三七二十一,就可以直接用long long型。