当前位置: 首页 > article >正文

【数据结构】排序算法系列——希尔排序(附源码+图解)

希尔排序

算法思想

希尔排序(Shell Sort)是一种改进的插入排序算法,希尔排序的创造者Donald Shell想出了这个极具创造力的改进。其时间复杂度取决于步长序列(gap)的选择。我们在插入排序中,会发现是对整体数据直接进行了统一的插入排序,每个数据之间的间隙是1,这里的1指的就是步长序列gap。在希尔排序中,我们会将整体数据一分为多份,进行散布式的插入排序,这时候每一个子序列之间的间隙就是gap——那么事实上我们也可以将插入排序就看成是gap=1的希尔排序。

我们来具体分析希尔排序的算法步骤:

  • 将待排序序列分为若干个序列,每个序列的间距n(gap)需要相同
  • 将这些子序列分别进行插入排序
  • 不断减小这个间距

那么我们减小这个间距的目的是什么呢?

gap > 1时我们可以称为预排序,目的是让数组更接近于有序。当gap = 1时,数组已经接近有序的了,就整体而言,最后一次整体的插入排序就可以大大提高效率——我们从插入排序的时间复杂度分析也可以看出,越接近有序,插入排序的效率就越高,从而可以达到优化的效果。

图解

图片来源于网络

可以看到每次减小gap的规律是将原先的gap/2,但事实上这只是其中一种处理方法,并不说明这是最优解。

C语言代码分析

//与插入排序类似,只是插入排序的间隔是1,而希尔排序的间隔是gap

//第一种思想:依次排序
//排完一组后,再排下一组
void ShellSort1(int arr[], int n)
{
	int gap = 3;//任意一个想要的间隔
	for (int j; j < gap; j++)
	{
		for (int i = gap; i < n; i += gap)
		{

			int end = i - gap;
			int tmp = arr[end + gap];
			while (end >= 0)
			{
				if (tmp >= arr[end])
				{
					arr[end + gap] = tmp;
					end -= gap;
				}
				else
				{
					break;
				}
			}
			arr[end + gap] = tmp;
		}
	}


}

//第二种思想:多组并排
void ShellSort2(int arr[], int n)
{
	int gap = 3;//任意一个想要的间隔
	
		for (int i = gap; i < n-gap; i ++)
		{

			int end = i;
			int tmp = arr[i + gap];
			while (end >= 0)
			{
				if (tmp >= arr[end])
				{
					arr[end + gap] = tmp;
					end -= gap;
				}
				else
				{
					break;
				}
			}
			arr[end + gap] = tmp;
		}
}

//gap越大,跳得越快,但一次排下来最无序
//gap越小,跳得越慢,但一次排下来更有序

注意

希尔排序实际上是个相当复杂的排序算法,这主要是跟它的步长序列gap到底该如何取、后续应该减小有关。这其中涉及到很多的数学分析以及数学公式,我们可以参考严蔚敏老师的解读:

在这里插入图片描述

以及殷人昆老师:

在这里插入图片描述

所以,本篇文章仅对其基本的算法思想和代码编写进行解析,如有兴趣深究希尔排序,各位读者们可以自行上网搜索有关知识~

时间复杂度

一般情况下,希尔排序的时间复杂度可以表示为:

  • 最好情况(已排序的情况):O(n log n)
  • 平均情况:取决于步长序列的选择,通常为**O(n1.3)-O(n2)**之间。
  • 最坏情况:O(n2)

希尔排序通过逐步减少步长来实现排序,初始的大步长使得数组元素可以较快地达到部分有序状态,最终通过小步长的插入排序完成排序。所以时间复杂度的具体分析也就取决于步长序列。

这里针对平均情况,我们进行一下简单的具体分析:

希尔排序的平均情况时间复杂度是比较复杂的。在实际应用中,常见的步长序列如希尔建议的序列(1, 3, 7, …, 2^k-1)或者Hibbard序列(1, 3, 7, 15, …, 2k-1)等,它们的时间复杂度通常就在**O(n1.3)-O(n2)**之间,这是经过数学算出来的结果。这些序列被设计为逐渐减小,从而在较早阶段快速减少逆序对的数量,然后在最后阶段完成排序。

总体来说,希尔排序的性能高度依赖于步长序列的选择。良好的步长序列可以显著改善排序的效率,使得平均情况下的时间复杂度能够在O(n^1.3)左右,而不好的选择则可能导致接近最坏情况的性能。

稳定性

鉴于希尔排序会改变前后元素的相对位置,所以:不稳定


http://www.kler.cn/news/293902.html

相关文章:

  • J.U.C Review - Stream并行计算原理源码分析
  • 基于发布-订阅模型的音视频流分发框架
  • 2024 第十二届重庆国际植保暨新型肥料农药产业博览会
  • 上海大学《2022年836+915自动控制原理真题及答案》 (完整版)
  • GIT:git add命令指定文件夹
  • dubbo 服务消费原理分析之应用级服务发现
  • [论文笔记]Making Large Language Models A Better Foundation For Dense Retrieval
  • 《长得太长也是错?——后端 Long 型 ID 精度丢失的“奇妙”修复之旅》
  • Python精选200Tips:11-20
  • JAVA学习-练习试用Java实现“删除有序数组中的重复项”
  • NLP中文本预处理
  • 反向沙箱-安全上网解决方案
  • [Docker]当下实测可用Docker镜像源
  • 专为游戏行业设计的安全防护盾——游戏盾
  • 企业财税自动化解决方案的安全与合规性保障
  • 完整指南:CNStream流处理多路并发框架适配到NVIDIA Jetson Orin (三) 代码编译、各种问题解决、代码修改
  • 使用Ansible实现高效服务器配置管理的最佳实践
  • el-table使用type=“expand”根据数据条件隐藏展开按钮
  • vue2,vue3基于elementUI的el-table实现复制粘贴功能
  • 【docker】基于docker-compose 安装elasticsearch + kibana + ik分词器(8.10.4版本)
  • HDFS工具类
  • 高级架构师备考计划
  • Maven持续集成(Continuous integration,简称CI)版本友好管理
  • tailwindcss在vue2中安装配置流程
  • Kafka大厂面试14问(附答案)
  • windows下php+nginx的wordpress配置教程和问题解决
  • Python绘制嫦娥奔月
  • IP和品牌有什么区别?
  • 深度学习每周学习总结N9:transformer复现
  • 牵手西安,产业园区如何“玩转”数字媒体产业?