当前位置：首页 > article >正文

数据结构——哈希表

article 2025/1/11 10:01:39

数据结构——哈希表

一、哈希表
- 1.基本介绍
- 2.作用
- 3.哈希函数
- 4.哈希碰撞
- - 拉链法
  - 线性探测法
- 5.常见的三种哈希结构
- 6.应用

一、哈希表

1.基本介绍

哈希表（Hash table，国内也有一些算法书籍翻译为散列表）是根据关键码的值而直接进行访问的数据结构。每个是以键值对key-value形式存储

其实数组就是一张哈希表。哈希表中关键码就是数组的索引下标，然后通过下标直接访问数组中的元素

2.作用

一般哈希表都是用来快速判断一个元素是否出现集合里

eg：要查询一个名字是否在这所学校里。
要枚举的话时间复杂度是 $O (n)$ ，但如果使用哈希表的话，只需要 $O (1)$ 就可以做到。

我们只需要初始化把这所学校里学生的名字都存在哈希表里，在查询的时候通过索引直接就可以知道这位同学在不在这所学校里了。

将学生姓名映射到哈希表上就涉及到了hash function ，也就是哈希函数。

3.哈希函数

哈希函数，把学生的姓名直接映射为哈希表上的索引，然后就可以通过查询索引下标快速知道这位同学是否在这所学校里了。
哈希函数能快速将一个数值转换成哈希值（整数）。所以哈希表必须保持哈希值的计算一致，如果两个哈希值是不相同的，那么这两个哈希值的原始输入也是不相同的。

通过hashCode把名字转化为数值，一般hashcode是通过特定编码方式，可以将其他数据格式转化为不同的数值，这样就把学生名字映射为哈希表上的索引数字了
在这里插入图片描述
如果hashCode得到的数值大于tableSize了，此时为了保证映射出来的索引数值都落在哈希表上，会在再次对数值做一个取模的操作，就要我们就保证了学生姓名一定可以映射到哈希表上了。

4.哈希碰撞

两元素映射到了同一索引位置，这一现象叫做哈希碰撞或哈希冲突。

一般哈希碰撞有两种解决方法，拉链法和线性探测法。

拉链法

将发生冲突的元素都存储在索引位置的链表中
在这里插入图片描述
拉链法就是要选择适当的哈希表的大小，这样既不会因为数组空值而浪费大量内存，也不会因为链表太长而在查找上浪费太多时间。

线性探测法

使用线性探测法，一定要保证tableSize（哈希表的大小）大于dataSize（数据规模）。我们需要依靠哈希表中的空位来解决碰撞问题。例如冲突的位置，放了A，那么就向下找一个空位放置B的信息。
在这里插入图片描述

5.常见的三种哈希结构

使用哈希法来解决问题的时候，我们一般会选择如下三种数据结构：

数组
set （集合）
map（映射）

使用数组来做哈希的题目，是因为题目限制了数值的大小。若没有限制数值的大小，就无法使用数组来做哈希表了。
而且如果元素个数少，哈希值比较少、特别分散、跨度非常大，使用数组就造成空间的极大浪费。

但使用set占用空间比数组大，而且速度要比数组慢，set把数值映射到key上要做hash计算

set是一个集合，里面放的元素只能是一个key。Map是映射结构，存放key-value键值对。

6.应用

当我们遇到了要快速判断一个元素是否出现集合里的时候，就要考虑哈希法。

但是哈希法也是牺牲了空间换取了时间，因为我们要使用额外的数组，set或者是map来存放数据，才能实现快速的查找。

如果在做题目的时候遇到需要判断一个元素是否出现过的场景也应该第一时间想到哈希法！

http://www.kler.cn/a/5940.html

相关文章：

Jenkins-持续集成、交付、构建、部署、测试

Linux 文件的特殊权限—ACL项目练习

每日一题-两个链表的第一个公共结点

IOS开发如何从入门进阶到高级

虹软人脸识别

【网络安全 | 漏洞挖掘】HubSpot 全账户接管（万字详析）

android 源码framework中加入自定义服务

【全网独家】华为OD机试Golang解题 - 机智的外卖员

我能“C”——详解操作符（下）

FFmpeg 入门学习 07--创建音视频解码管理类

图片怎么转PDF文件？三种免费转换方法集合！

3、AI的道德性测试

linux宝塔面板安装composer的方法[全网详解]

@Transactional和synchronized同时使用时的一些问题以及解决

YOLO算法改进指南【算法解读篇】：2.如何训练自己的数据集

13、操作系统——posix信号量（无名信号量）

python开启局域网传输

【C++笔试强训】第五天

不相交的集合数据结构

PerfEnforce Demonstration: Data Analytics with Performance Guarantees

涨点技巧：Yolov5/Yolov7 引入Yolo-Z---ResneXtBottleneckCSP和DenseBlock，提升小目标检测能力

PCB模块化设计13——FLASH、DDR和eMMC高速PCB布局布线设计规范

QT学习（四）——常用控件

阿里P8高级技术专家自述被裁员，疑似给市长写信，房贷月供3w，压力很大，出门面试找工作很难！...

谷粒商城笔记+踩坑（22）——库存自动解锁。RabbitMQ延迟队列

python---数据容器