当前位置: 首页 > article >正文

处理哈希冲突

有时候哈希表⽆论选择什么哈希函数都⽆法避免冲突,那么插⼊数据时,如何解决冲突呢?主要两种⽅法,线性探测法和链地址法,这篇先做原理描述,下篇实现代码模拟

一、线性探测

发生冲突的位置开始,依次线性向后探测,直到寻找到下一个没有存储数据的位置为止,如果走到哈希表尾,则回绕到哈希表头的位置。

案例:

第一个元素19计算的哈希值为8,所以找到标的位置8,把19塞到这里面,第二个元素30的哈希值也是8,但下标9里面已经有19了,此时出现哈西冲突,用线性探测法解决这个哈希冲突就是依次向后寻找一个没有存储数据的位置,也就是放到下标9的位置,接着5放到下标5,36放到下标3,3放到下标2,20放到下标9,9里面已经有30了,便放到下一个位置10,21放到下标10,下标10已经有20了且走到表尾,没关系,从表头开始依次向后找,我们可以把哈希表看成环的形式,走到表尾之后再继续走到前21放到下标0,12放到下标1,这样就把所有的数据利用线性探测的方式全都存到哈希表里了,如果我想确定一下21这个数有没有存到表中,根我们存储的形式是一样的,首先计算出来它的哈希值为10,从10位置依次向后找看有没有21这个数就可以了

但是有一个致命问题,假设给数组添加一个数据8,8%11=8,存到下标8的这个位置出现哈西冲突,所以要向后探测,发现9 10 0 1 2 3下标都存着数据,直到4的时候才找到空位置,并把8存了进去,因此线性探测是有它的弊端的,如果哈希表里面存的数很密集,有可能要线性探测很多次,这样的哈希表想O(1)来查找以及存储每一个数据是做不到的,其实也有方法解决这个弊端,创建个大一点的数组,比如题目里面有八个数据,可以创建一个是它两倍大小的数组,并且把哈希函数的模数在原有的数值上×2,在它的附近找一个质数去模

二、链地址法

链地址法中所有的数据不再直接存储在哈希表中,哈希表中存储一个指针,没有数据映射这个位置时这个指针为空,有多个数据映射到这个位置时,我们把这些冲突的数据链接成一个链表,挂在哈希表这个位置下面。

案例:

给定数组 a={19,30,5,36,13,20,21,12,24,96},哈希函数为 hash(key)= key % 11;h(19)= 8.h(30)=8.h(5)=5.h(36)=3.h(13)=2h(20)=9.h(21)=10,h(12)=1.h(24)=2.h(96)=8

如上图12的哈希值为1,就会把12以链表的形式挂在下标1上,24和13挂在下标2的哈希表中,以此类推,解释一下,下面8挂着的链表96 30 19,明明是19先插入的,为什么他会在最后,因为这个链表的插入操作是头插

当然它也有弊端,如果所有的数全都冲突挂在下标8,这个链表就会特别长,往后查找一个数的时候,他的时间复杂就变成O(N)了,这个解决方式是不用链表挂,而是用红黑树,这时候时间复杂会变成logN级别


http://www.kler.cn/a/554802.html

相关文章:

  • 地面沉降监测,为地质安全保驾护航
  • 网络安全 逆向 apk 网络安全逆向分析
  • 图数据库Neo4j面试内容整理-建模实践
  • 云原生监控体系建设:Kubernetes架构下的全面监控策略
  • Openssl之SM2加解密命令
  • 我国首条大型无人机城际低空物流航线成功首航
  • 【时时三省】(C语言基础)三种基本结构和改进的流程图
  • 计算机视觉之图像处理-----SIFT、SURF、FAST、ORB 特征提取算法深度解析
  • 一周学会Flask3 Python Web开发-response响应格式
  • 基于GraphQL的电商API性能优化实战
  • 项目管理的核心是什么?
  • DeepSeek vs ChatGPT:AI 领域的华山论剑,谁主沉浮?
  • 【机器学习】衡量线性回归算法最好的指标:R Squared
  • unity学习50:NavMeshAgent 区域Areas和cost
  • ES三种查询方式,为什么searchAfter效率高
  • 全志A133 android10 适配SLM770A 4G模块
  • 网络安全入门攻击与防御实战(四)
  • 卷积神经网络实战宠物狗识别
  • 从硬件工程师视角解析宇树机器人:四足机器人的核心设计与技术挑战
  • leetcode876.链表的中间结点