当前位置: 首页 > article >正文

mysql 索引(为什么选择B+ Tree?)

索引实现原理

索引:排好序数据结构
优点:降低I/O成本,CPU的资源消耗(数据持久化在磁盘中,每次查询都得与磁盘交互)
缺点:更新表效率变慢,(更新表数据,还要更新索引),占用空间
分类:主键索引,唯一索引,单值索引,组合索引

索引的数据结构

Hash表(舍弃:不适合范围查找和排序)

hash 是一维数组 + 二维链表:取模后进行存储

对于hash算法的CRUD来讲,时间复杂度为O(1)
但对于范围查询和排序来讲,时间复杂度又从最好变为O(n)

在这里插入图片描述

二叉树(舍弃:自增序列无效)

理想情况
在这里插入图片描述

mysql不使用的原因:对于自增数据,树左倾或右倾形成链表,时间复杂度变回了O(n)
在这里插入图片描述

红黑树(舍弃:树会很高)

本质就是二叉树,相比较于二叉树,他有平衡功能(当一边高时,会自动更新根节点),又称为二叉平衡树
在这里插入图片描述

mysql 不使用原因:数据量大的时候,树会更高,查找到叶子节点效率也会慢,每层就是一次IO

B Tree(舍弃:每个节点存放数据,可以优化)

特点:在每个节点,放多个索引
优点:树就不会高,但每个节点都会存data数据,会占据很大的磁盘空间
在这里插入图片描述

B+ Tree(mysql默认)

优点:
1.非叶子节点不储data,只存储索引,可以放更多的索引
2.叶子节点包含所有索引+data字段,由双向链表排成一行(更好的实现范围查找和排序)
3.叶子节点用指针连接,提高区间访问的性能

mysql 默认每个节点为16KB,
例如:若使用bigInt的主键,每个节点大概可放1170 个索引,若树高3层,则为1170*1170 *16 约为2000多万索引

在这里插入图片描述

总结:(数据存叶子节点,双向链表)

BTree 和B+Tree都是多路搜索树,区别在于叶子节点和非叶子节点的处理。
1.BTree 每个节点都储存索引+数据,B+Tree 的非叶子节点只存储索引+指向叶子节点的指针,数据存到叶子节点,这样B+Tree 的非叶子节点就可以放更多的索引,树的层级也就降低了,这样查找更快,减少了磁盘IO
2.B+Tree 的叶子节点都有指针相连接,形成双向链接表,这样在范围和排序时更快,而BTree 的叶子节点没有相连接,范围查找时还得向父节点查找。所以B+Tree 的范围查找和排序更好

数据结构训练网址

https://www.cs.usfca.edu/~galles/visualization/Algorithms.html


http://www.kler.cn/a/272601.html

相关文章:

  • Web前端------表单标签
  • 某国际大型超市电商销售数据分析和可视化
  • 物联网网关Web服务器--Boa服务器移植与测试
  • IoTDB 数据类型相关问题
  • ASP.NET Core - 配置系统之配置添加
  • 小白:react antd 搭建框架关于 RangePicker DatePicker 时间组件使用记录 2
  • RocketMQ - 发送消息时Producer是如何选择MessageQueue去发送的?
  • 画图实战-Python实现某产品全年销量数据多种样式可视化
  • mac下Appuim环境安装
  • 【设计模式】Java 设计模式之工厂模式(Factory Pattern)
  • 就业班 2401--3.13 走进网络
  • Trustzone和Tee的基本概念区分
  • C语言文件操作 w模式
  • 【计算机网络篇】物理层(2)传输方式
  • 贪心算法(算法竞赛、蓝桥杯)--线段覆盖
  • #LLM入门|Prompt#3.3_存储_Memory
  • 生成器建造者模式(Builder)——创建型模式
  • QT 如何防止 QTextEdit 自动滚动到最下方
  • modbus客户端
  • Tensorflow笔记(二):激活函数、优化器等、神经网络模型实现(商品销量预测)
  • C/C++程序设计实验报告3 | 数组实验
  • FPGA高端项目:FPGA基于GS2971+GS2972架构的SDI视频收发+HLS多路视频融合叠加,提供1套工程源码和技术支持
  • 配置LVS NAT模式
  • 单据分页的实现
  • 机试:高精度乘法
  • 【数据库】数据库基本知识