当前位置：首页 > article >正文

【初阶数据结构】星河中的光影 “排” 象：排序（上）

article 2025/3/1 14:43:32

文章目录

1.排序的概念及分类
2.插入排序
- 2.1 直接插入排序（InsertSort）
- 2.2 希尔排序（ShellSort）
3.选择排序
- 3.1 直接选择排序（SelectSort）
- 3.2 堆排序（HeapSort）
希望读者们多多三连支持
小编会继续更新
你们的鼓励就是我前进的动力！

本章节是初阶数据结构最后一个部分，排序在数据中的应用是特备常见的，一般在企业中的排序数据量成万上亿，所以选取一种合适且效率高的排序尤为重要

1.排序的概念及分类

排序，就是使一串记录，按照其中的某个或某些关键字的大小，递增或递减的排列起来的操作

常见的排序算法的可以按如图所示分类：

在这里插入图片描述

以下所有的排序算法均以升序的方式实现

2.插入排序

2.1 直接插入排序（InsertSort）

直接插入排序是一种简单的插入排序法，其基本思想是： 把待排序的记录按其关键码值的大小逐个插入到一个已经排好序的有序序列中，直到所有的记录插入完为止，得到一个新的有序序列

简单来说我们平常玩的扑克牌游戏就是一种插入排序：

在这里插入图片描述

排序原理：

当插入第 i ( i >= 1 ) 个元素时，前面的 array[0] ，array[1] ，… ，array[i-1] 已经排好序，此时用 array[i] 的排序码与 array[i - 1] ，array[i - 2] ，… 的排序码顺序进行比较，找到插入位置即将 array[i] 插入，原来位置上的元素顺序后移

动图理解：

请添加图片描述

💻排序实现：

void InsertSort(int* a, int n)
{
	for (int i = 1; i < n; ++i)
	{
		int end = i - 1;
		int tmp = a[i];
		while (end >= 0)
		{
			if (tmp < a[end])
			{
				a[end + 1] = a[end];
				--end;
			}
			else
			{
				break;
			}
		}
		a[end + 1] = tmp;
	}
}

⌨️代码解读：

第一个 for 循环指的是从第一个数开始依次往后遍历，end 指向已排序部分的最后一个元素（即开始的 a[0] ），tmp = a[i] 提前保存该位置的数据，避免移动时的覆盖消除该数据。
从后往前遍历已排序部分，找到合适的插入位置，如果当前要插入的元素小于已排序部分的元素，将已排序部分的元素后移一位，--end 继续向前比较；如果找到合适的插入位置，break 退出循环
找到合适位置后，a[end + 1] = tmp 将当前要插入的元素插入到合适的位置

🖱️复杂度分析：

• 时间复杂度：

○ 最好情况： 数组已经是有序的，此时内层的 while 循环每次只需要比较一次就会退出，时间复杂度为 O(n)

○ 最坏情况： 数组是逆序的，内层的 while 循环每次都需要比较到已排序部分的第一个元素，时间复杂度为 O(n²)

○ 平均情况： 时间复杂度为 O(n²)

• 空间复杂度： O(1)

总结：元素集合越接近有序，直接插入排序算法的时间效率越高

2.2 希尔排序（ShellSort）

希尔排序又称缩小增量法。其基本思想是： 先选定一个整数 gap ，把待排序文件中所有记录分成多个组，所有距离为 gap 的记录分在同一组内，并对每一组内的记录进行排序。然后，取新的 gap ，重复上述分组和排序的工作。当到达 gap = 1 时，所有记录在统一组内排好序

分组如图所示：

在这里插入图片描述

相同颜色的数字为同一组

💻排序实现：

版本1： 按组分配排序

void ShellSort(int* a, int n)
{
	int gap = n;
	for(int j = 0; j < gap; j++)
	{
		gap /= 2;
		for (int i = j; i < n - gap; i += gap)
		{
			int end = i;
			int tmp = a[i + gap];
			while (end >= 0)
			{
				if (tmp < a[end])
				{
					a[end + gap] = a[end];
					end -= gap;
				}
				else
				{
					break;
				}
				a[end + gap] = tmp;
			}
		}
	}
}

版本2： 依次排序

void ShellSort(int* a, int n)
{
	int gap = n;
	while (gap > 1)
	{
		gap /= 2;
		//gap = n / 3 + 1;
		for (int i = 0; i < n - gap; i++)
		{
			int end = i;
			int tmp = a[i + gap];
			while (end >= 0)
			{
				if (tmp < a[end])
				{
					a[end + gap] = a[end];
					end -= gap;
				}
				else
				{
					break;
				}
				a[end + gap] = tmp;
			}
		}
	}
}

⌨️代码解读：

希尔排序其实和插入排序是十分相似的，希尔排序是对直接插入排序的优化，只不过是每间隔 gap 个数进行排序，插入排序间隔是 1 ，通过多次 gap 的改变，多次的分组排序最终能趋向于有序

🔥值得注意的是：

for 循环中 i < n - gap 是因为排完序后剩下的数根据 gap 的大小，剩下的数已经自动有序了
gap /= 2 和 gap = n / 3 + 1 都是可以的，并没有严格的限制
tmp 一直在 end 的下一个位置，插入的位置一直在 end 的下一个位置
当 gap > 1 时都是预排序，目的是让数组更接近于有序。当 gap == 1 时，数组已经接近有序的了，这样就会很快
希尔排序的时间复杂度不好计算，因为 gap 的取值方法很多，导致很难去计算，因此在好些书中给出的希尔排序的时间复杂度都不固定

《数据结构(C语言版)》— 严蔚敏：

在这里插入图片描述

🖱️复杂度分析：

• 时间复杂度：

○ 最好情况： 数组已经是有序的，时间复杂度为 O(n)

○ 最坏情况： 数组是逆序的，时间复杂度为 O(n²)

○ 平均情况： 时间复杂度大约为 O( $n^{1.3}$ )

• 空间复杂度： O(1)

总结： 希尔排序是不稳定的

3.选择排序

3.1 直接选择排序（SelectSort）

直接选择排序可以说是最简单的一种排序了，其基本思想为： 每一次从待排序的数据元素中选出最小（或最大）的一个元素，存放在序列的起始位置，直到全部待排序的数据元素排完

排序原理：

在元素集合 array[i] – array[n-1] 中选择关键码最大(小)的数据元素
若它不是这组元素中的最后一个(第一个)元素，则将它与这组元素中的最后一个（第一个）元素交换
在剩余的 array[i] – array[n-2]（array[i+1] – array[n-1]）集合中，重复上述步骤，直到集合剩余 1 个元素

动图理解：

请添加图片描述

💻排序实现：

void Swap(int* p1, int* p2)
{
	int tmp = *p1;
	*p1 = *p2;
	*p2 = tmp;
}

void SelectSort(int* a, int n)
{
	int left = 0, right = n - 1;
	while (left < right)
	{
		int mini = left, maxi = right;
		for (int i = left; i <= right; ++i)
		{
			if (a[i] < a[mini])
			{
				mini = i;
			}

			if (a[i] > a[maxi])
			{
				maxi = i;
			}
		}

		Swap(&a[left], &a[mini]);
		//如果left和maxi重叠，交换后修正一下
		if (left == maxi)
		{
			maxi = mini;
		}
		Swap(&a[right], &a[maxi]);

		++left;
		--right;
	}
}

⌨️代码解读：

mini 初始化为 left，maxi 初始化为 right，用于记录当前未排序部分的最小值和最大值的索引
通过 for 循环从 left 到 right 遍历数组，比较每个元素与 a[mini] 和 a[maxi] 的大小，如果发现更小的元素则更新 mini，如果发现更大的元素则更新 maxi
调用 Swap 函数将最小值 a[mini] 交换到左边界 a[left] 的位置，最大值 a[maxi] 交换到右边界 a[right] 的位置
++left 和 --right 分别将左边界右移和右边界左移，缩小未排序部分的范围