当前位置：首页 > article >正文

数据结构之排序补充

article 2025/4/2 15:37:49

1. 非比较排序

上一篇文章我们罗列了数据结构中排序的八种方法。这八种方法都是需要比较才能实现的，那怎么样才可以通过非比较的方法来实现数组的排序呢？这里就提供一种非比较排序的方法。

具体的操作思路如下：

1. 先统计待比较数组arr中重复数组的个数，并相对应的记录下来。

2. 在另一个第二个新开辟的数组count里，将arr数组中的元素当作下标，将对应元素出现的个数作为元素对应放。

3. 然后遍历count数组里面的元素，如果元素不为零，就将这个数据的下标作为元素返回给原数组arr，将这个数据的元素作为返回次数继续返回。

4. 原数组arr此时就有序了。

我们可以根据上面的思路看一下下面这个例子：

上面的数组为arr，下面的数组为count，先看arr数组中，6出现1次，1出现2次，2出现2次，9出现1次，4出现3次。所以在count数组中，下标为6的位置为1，下标为1的位置为2，下标为2的位置为2，下标为9的位置为1，下标为4的位置3。

然后遍历count数组，下标为0没有元素，跳过，下标为1有2，那么就在arr数组中从下标为0开始，连续放两个1，然后继续遍历count数组，连续放两个2，三个4，1个6，1个9。就得到了新的arr数组1 1 2 2 4 4 4 6 9。

这种方法需要新开辟一个数组用于暂时存放数组，而这个新开辟的count数组大小与原arr数组中的最大元素是息息相关的。现在我们试着排下面这个数组：

由第一个例子我们不难知道，开辟count数组的空间就需要109＋1=110（看上面的例子，要以元素中的最大值作为下标，就需要比最大值还要多一个空间大小，因为还有下标为0的位置）个整形大小的空间。而这个数组中最小值为100，意思是在tmp数组中，只有在下标为100的时候才会有元素出现，这样子的话前面99个整形大小的空间就被浪费了。并且如果数组里面的元素有负数的话，又不可能将这个负数的个数放在下标为负数的空间里。而我们利用计算机排序的数组中，这两种情况更多。所以我们可以采用下面这种优化的方法。

1. 同上，先将arr数组中的元素以及元素重复的个数对应的存储下来。数组的最大值为max，最小值为min。

2. 开辟max-min+1个空间作为count数组的空间大小。现在开辟的空间里面的值都是随机的，我们通过memset函数将空间里面的整型都初始化为0。

3. 假设arr数组中下标为i的arr[i]元素重复了n次，那么就在count数组中下标为arr[i]-min的位置定为n。

4. 当arr数组的情况全部放入count数组的后，遍历count数组，将count数组中元素不为零的下标为j的数据作为放回去的次数，值为i+min，从arr[0]开始依次放回去。

5. 此时arr数组的元素全部有序。

现在我们继续以上面的示例数组{100，101，109，105，101，105}为例详细讲解一下这个过程：

首先原数组依然命名为arr，新开辟的数组为count。arr数组中最大值为109，最小值为100。所以开辟的count数组的大小为109-100+1=10个整型空间大小。100出现的次数为1次，101出现的次数为2次，109出现的个数为1次，105出现的个数为2次。所以在count数组中，下标为100-100=0的位置的数据为1，下标为101-100=1的位置的数据为2，下标为109-100=9的位置的数据为1，下标为105-100=5的位置的数据为2。

然后遍历count数组，若数组元素为0的话直接跳过，若不为0，则将下标为j的元素count[j]作为上传次数，将j+min作为上传的数据，从arr[0]开始依次按顺序上传上去。连续放count[j]个大小为j+min的数据。最后就得到有序的数组arr{100，101，101，105，105，109}.

通过这个过程，我们可以写一下代码：

//非比较排序
void CountSort(int* arr, int n)
{
	//先找数组arr中最大值max和最小值min，这里还是需要用到比较
	int min = arr[0];
	int max = arr[0];
	for (int i = 0; i < n; i++)
	{
		if (arr[i] > max)
		{
			max = arr[i];
		}
		if (arr[i] < min)
		{
			min = arr[i];
		}
	}

	//开辟range个整型空间大小的数组count
	int range = max - min + 1;
	int* count = (int*)malloc(sizeof(int) * range);
	if (count == NULL)
	{
		perror("malloc fail!");
		exit(1);
	}

	//将count数组里面的元素都初始化为0
	memset(count, 0, sizeof(int) * range);

	//将arr中下标为i的元素arr[j]-min作为下标传给count，将arr中元素出现的次数作为对应数值传给count
	for (int i = 0; i < n; i++)
	{
		count[arr[i] - min]++;
	}

	//将count中的下标j加上min作为数值传给arr，将count[j]作为连续的上传次数
	int index = 0;
	for (int j = 0; j < range; j++)
	{
		while (count[j]--)
		{
			arr[index++] = j + min;
		}
	}
}

我们可以根据下面这个代码测试一下排序算法所需要的时间：

void test()
{
	srand((unsigned int)time(0));
	const int N = 100000;

	int* a1 = (int*)malloc(sizeof(int) * N);
	int* a2 = (int*)malloc(sizeof(int) * N);
	int* a3 = (int*)malloc(sizeof(int) * N);
	int* a4 = (int*)malloc(sizeof(int) * N);
	int* a5 = (int*)malloc(sizeof(int) * N);
	int* a6 = (int*)malloc(sizeof(int) * N);
	int* a7 = (int*)malloc(sizeof(int) * N);
	int* a8 = (int*)malloc(sizeof(int) * N);

	for (int i = 0; i < N; i++)
	{
		a1[i] = rand();
		a2[i] =a1[i];
		a3[i] = a1[i];
		a4[i] = a1[i];
		a5[i] = a1[i];
		a6[i] = a1[i];
		a7[i] = a1[i];
		a8[i] = a1[i];
	}

	//测试冒泡排序
	int begin1 = clock();
	BubbleSort(a1, N);
	int end1 = clock();

	//测试直接插入排序
	int begin2 = clock();
	InsertSort(a2, N);
	int end2 = clock();

	//测试希尔排序
	int begin3 = clock();
	ShellSort(a3, N);
	int end3 = clock();

	//测试直接选择排序2
	int begin4 = clock();
	SelectSort2(a4, N);
	int end4 = clock();

	//测试快排hoare版本
	int begin5 = clock();
	QuickSort(a5, 0, N - 1);
	int end5 = clock();

	//测试非递归版本
	int begin6 = clock();
	QuickSortNonR(a6, 0, N - 1);
	int end6 = clock();

	//测试归并排序
	int begin7 = clock();
	MergeSort(a7, N);
	int end7 = clock();

	//测试非比较排序
	int begin8 = clock();
	CountSort(a8, N);
	int end8 = clock();

	printf("BubbleSort:%d\n", end1 - begin1);
	printf("InsertSort:%d\n", end2 - begin2);
	printf("ShellSort:%d\n", end3 - begin3);
	printf("SelectSort2:%d\n", end4 - begin4);
	printf("QuickSort:%d\n", end5 - begin5);
	printf("QuickSortNonR:%d\n", end6 - begin6);
	printf("MergeSort:%d\n", end7 - begin7);
	printf("CountSort:%d\n", end8 - begin8);

	free(a1);
	free(a2);
	free(a3);
	free(a4);
	free(a5);
	free(a6);
	free(a7);
	free(a8);

}

代码的结果如下：