当前位置：首页 > article >正文

【MySQL-24】万字全面解析＜索引＞——【介绍＆语法＆性能分析＆使用规则】

article 2025/2/21 11:01:51

前言

大家好吖，欢迎来到 YY 滴MySQL系列，热烈欢迎！本章主要内容面向接触过C++的老铁
主要内容含：

欢迎订阅 YY滴C++专栏！更多干货持续更新！以下是传送门！

YY的《C++》专栏
YY的《C++11》专栏
YY的《Linux》专栏
YY的《数据结构》专栏
YY的《C语言基础》专栏
YY的《单片机》专栏
YY的《STM32》专栏
YY的《数据库》专栏

一.索引概述
- 1.索引基本概念
- 2.索引的优缺点
二.索引结构＆分类
- 1.介绍＆不同索引在不同引擎中的适用情况
- 2.Btree（多路平衡查找树）
- - 【1】为什么不用二叉树的原因
  - 【2】Btree
- 3.B+tree
- - 【1】B+tree
  - 【2】为什么InnoDB存储引擎选择使用B+tree索引结构?
- 4.hash哈希
三.索引不同分类方式＆演示
四.索引的语法＆完成需求演示
- 1.索引的语法
- 2.完成需求演示
五.索引性能分析工具——>为sql优化(select)做准备
- 1.查看SQL执行频次
- - 【1】为什么要关注执行频率
  - 【2】查看SQL执行频次语法＆演示
- 2.慢查询日志
- - 【1】慢查询日志机理机理＆作用＆语法
  - 【2】演示：查看慢查询日志开关是否开启
  - 【2】演示：Linux中配置慢查询日志
  - 【3】演示：实时监测慢查询日志
- 3.profiles详情——（解决慢查询日志--自定义问题）
- - 【1】慢查询日志机理机理＆作用＆语法
  - 【2】演示：打开profiles开关前后对比
  - 【3】演示：执行一系列的业务SQL的操作，然后通过profile查看指令的执行耗时/各个阶段耗时/CPU使用情况:
- 4.explain执行计划（最常用）
- - 【1】explain执行计划＆语法
  - 【2】explain执行计划演示
  - 【3】explain执行计划各个字段的含义
六.索引使用规则
- ※.验证索引效率提升
- 1.覆盖索引——查询使用了索引，并且需要返回的列，在该索引中已经全部能够找到
- 2.单列索引＆联合索引
- 3.前缀索引——解决冗长字符串与索引问题
- - 【1】前缀索引＆索引选择性的介绍
  - 【2】前缀索引创建演示：
- 5.SQL提示——指定某个索引/忽略索引/强制索引
- 6.数据分布影响——MySQL自我评估
- 7.查询失效的几种情况
- - 【1】违背——最左前缀法则(联合索引)
  - 【2】范围查询右侧失效
  - 【3】用or分割开的条件，or后面没索引，所有索引失效
  - 【4】索引列上进行运算操作，索引失效
  - 【5】字符串类型字段使用时，不加引号，索引失效
  - 【6】头部模糊匹配，索引失效

一.索引概述

1.索引基本概念

索引(index)是帮助MvSOL 高效获取数据的 数据结构(有序)
低效获取数据：例如全表扫描等
高效获取数据：二叉树等（示意图而已，不是真实索引结构）

2.索引的优缺点

优点：

提高数据检索的效率 ，降低数据库的IO成本
通过索引列对数据进行排序， 降低数据排序的成本 ，降低CPU的消耗

缺点：

索引列也是要 占用空间的
索引大大提高了查询效率，同时却也 降低更新表的速度 ，如对表进行INSERT、UPDATE、DELETE时，效率降低

二.索引结构＆分类

1.介绍＆不同索引在不同引擎中的适用情况

MySQL的索引是在存储引擎层实现的，不同的存储引擎有不同的结构，主要包含以下几种:

B+Tree索引： 最常见 的索引类型，大部分引擎都支持 B+ 树索引
Hash索引：底层数据结构是用哈希表实现的,只有精确匹配索引列的查询才有效, 不支持范围查询
R-tree(空间索引)：空间索引是MVISAM引擎的一个特殊索引类型，主要用于 地理空间数据类型 ，通常使用较少
Full-text(全文索引)：是一种通过建立倒排索引,快速匹配文档的方式。类似于Lucene,Solr,ES

不同索引在不同引擎中的适用情况：
在这里插入图片描述

2.Btree（多路平衡查找树）

【1】为什么不用二叉树的原因

特性：比节点小排左边，比节点大排右边
缺点： 顺序插入 时，会形成一个链表，查询性能大大降低。大数据量情况下，层级较深
检索速度慢

【2】Btree

在这里插入图片描述

3.B+tree

【1】B+tree

特点： 所有的元素都会出现在叶子节点，形成单向链表
机制：非叶子节点充当 索引作用 ，即指针；叶子节点 存放数据

在这里插入图片描述

MySQL索引数据结构对经典的B+Tree进行了优化。在原B+Tree的基础上，增加一个指向相邻叶子节点的链表指针，就形成了 带有顺序指针 的B+Tree，提高区间访问的性能。
InnoDB引擎的逻辑存储结构，表空间->段->区->页->行； 页在InnoDB引擎中默认大小16k

在这里插入图片描述

【2】为什么InnoDB存储引擎选择使用B+tree索引结构?

相对于二叉树，层级更少 ，搜索效率高
对于B-tree，无论是叶子节点还是非叶子节点，都会保存数据，这样导致一页中存储的键值减少，指针跟着减少，要同样保存大量数据，只能增加树的高度，导致性能降低
相对Hash索引，B+tree支持 范围匹配 及 排序操作 ；

4.hash哈希

哈希索引就是采用 一定的hash算法 ，将键值换算成新的hash值， 映射到对应的槽位上，然后存储在hash表中 。
如果两个(或多个)键值，映射到一个相同的槽位上，他们就产生了hash冲突(也称为hash碰撞)，可以通过链表来解决。

在这里插入图片描述
Hash索引特点：

Hash索引只能用于对等比较(=，in)，不支持范围查询(between，>，<，…)
无法利用索引完成排序操作
查询效率高，通常只需要一次检索就可以了，效率通常要高于B+tree索引

存储引擎支持：

在MySQL中，支持hash索引的是 Memory引擎
而innoD8中具有 自适应hash功能 ，hash索引是存储引擎根据B+Tree索引在指定条件下自动构建的。

三.索引不同分类方式＆演示

索引常规分为4种，分别是：

主键索引：针对于表中主键创建的索引，默认自动创建, 只能有一个 ， 关键字PRIMARY
唯一索引：避免同一个表中某数据列中的值重复，可以有多个， 关键字UNIQUE
常规索引：快速定位特定数据，可以有多个，无关键字
全文索引：全文索引查找的是 文本中的关键词 ，而不是比较索引中的值，可以有多个， 关键字FULLTEXT

在InnoDB存储引擎中，根据索引的存储形式，又可以分为以下两种：

聚集索引(Clustered Index)：将 数据存储与索引放到了一块，索引结构的叶子节点保存了行数据。 必须有，而且只有一个
二级索引(SecondaryIndex)： 将数据与索引分开存储，索引结构的叶子节点关联的是对应的主键。 可以存在多个

聚集索引存储规则:

如果存在主键，主键索引就是聚集索引 (聚集索引一定存在)
如果不存在主键，将使用第一个唯一(UNIQUE)索引作为聚集索引
如果表没有主键，或没有合适的唯一索引，则InnoDB会自动生成一个rowid作为隐藏的聚集索引

聚集索引和二级索引演示：

四.索引的语法＆完成需求演示

1.索引的语法

创建索引

CREATE [UNIQUE|FULLTEXT] INDEX index_name ON table_name ( index_col_name,...) ;

查看索引

SHOW INDEX FROM table_name  （最后加上\G，可转换显示方式，由列展示变行展示）

删除索引

DROP INDEX index_name ON table_name;

2.完成需求演示

按照下列的需求，完成索引的创建：

介绍表tb_user表：
需求
查看索引

-- 需求1：name字段为姓名字段，该字段的值可能会重复，为该字段创建索引。
create index idx_user_name on tb_user(name);

-- 需求2：phone手机号字段的值，是非空，且唯一的，为该字段创建唯一索引。
create unique index idx_user_phone on tb_user(phone);

-- 需求3：为profession、age、status创建联合索引。
create index idx_user_pro_age_sta on th_user(profession,age,status);

-- 需求4：为email建立合适的索引来提升查询效率。
create index idx user_email on tb_user(email);

-- 删除索引
drop index idx_user_email on tb_user;

五.索引性能分析工具——>为sql优化(select)做准备

1.查看SQL执行频次

【1】为什么要关注执行频率

有张表数据量大，但是只插入不查询，所以没必要优化；
通过查看增删改/查占数据库操作的比例， 来判断是否需要优化

【2】查看SQL执行频次语法＆演示

MySQL客户端连接成功后，通过show [sessionlglobal] status命令可以提供服务器状态信息。通过如下指令，可以查看当前数据库的INSERT、UPDATE、DELETE、SELECT的访问频次:

SHOW GLOBAL STATUS LIKE 'Com_______‘; --模糊匹配，7个_代表7个字符

我们要关注增删查改操作

2.慢查询日志

【1】慢查询日志机理机理＆作用＆语法

慢查询日志记录了所有执行时间超过 指定参数 (longquerytime，单位:秒， 默认10秒 )的所有SOL语句的日志——————> 要自定义参数可看下文【3.profile详情】
慢查询日志的作用：一段操作后，我们可以在其中定位到效率比较低的sql，从而进行优化
MySQL的 慢查询日志默认没有开启 需要在MySQL的配置文件(/etc/my.cnf)中配置如下信息:
配置完毕之后，通过以下指令重新启动MSQL服务器进行测试，查看慢日志文件中记录的信息/var/lib/mysql/localhost-slow.log。

【2】演示：查看慢查询日志开关是否开启

show variables like 'slow query log';

在这里插入图片描述

【2】演示：Linux中配置慢查询日志

登录linux，编辑mysql下的配置文件：/etc/my.cnf
大G跳到最后
输入

slow_query_log=1
long_query_time=2

在这里插入图片描述

重新连接后；再次查询，发现接口已开启

【3】演示：实时监测慢查询日志

我们开启两个窗口，第一个窗口输入如下代码查看慢查询日志实时情况

tail -f localhost-slow.1og

在这里插入图片描述

第二个窗口执行一条select语句，由于用时没有超过10s，所以在第一个窗口中没有显示
第二个窗口执行一条典型性能低select语句，用时超过10s，所以在第一个窗口中显示

在这里插入图片描述

3.profiles详情——（解决慢查询日志–自定义问题）

【1】慢查询日志机理机理＆作用＆语法

慢查询日志只记录超过10s的sql记录，想要自定义要通过profiles
show profiles 能够在做SQL优化时帮助我们了解时间都耗费到哪里去了
通过have profiling参数，能够看到当前MySQL 是否支持 profile操作：

SELECT @@have_profiling ;

默认profiling是关闭的 ，可以通过set语句在session/global级别开启profiling
通过以下语句，能够看到当前profile操作 是否开启

SET profiling=1;

查看profiling状态

select @profiling;

执行一系列的业务SQL的操作，然后通过如下指令查看指令的执行耗时:

在这里插入图片描述

【2】演示：打开profiles开关前后对比

在这里插入图片描述

【3】演示：执行一系列的业务SQL的操作，然后通过profile查看指令的执行耗时/各个阶段耗时/CPU使用情况:

在这里插入图片描述

执行一系列sql语句
查询profiles
我们想知道最后一条语句，为何花了9s多，耗费在哪些地方，我们可以接着操作
加上cpu，可以查看指定query id的SQL语句CPU的使用情况

4.explain执行计划（最常用）

【1】explain执行计划＆语法

EXPLAIN 或者 DESC命令获取 MySQL如何执行 SELECT语句的信息，包括在 SELECT语句执行过程中表如何连接和连接的顺序。
在这里插入图片描述

【2】explain执行计划演示

在select语句前加入explain或desc即可

在这里插入图片描述

【3】explain执行计划各个字段的含义

ID：select查询的序列号，表示查询中执行select子句或者是操作表的顺序(id相同，执行顺序从上到下； id不同，值越大，越先执行 )
select_type：表示 SELECT的类型，常见的取值有 SIMPLE(简单表，即不使用表连接或者子查询)、PRIMARY(主查询，即外层的查询)、UNION(UNION 中的第二个或者后面的查询语句)、SUBQUERY(SELECT/WHERE之后包含了子查询)等
type：表示连接类型，性能由好到差的连接类型为NULL、system、const、eq_ref、ref、range、index、all
possible_key：显示可能应用在这张表上的索引，一个或多个
Key：实际使用的索引，如果为NULL，则没有使用索引。
Key_len：表示索引中使用的字节数，该值为索引字段最大可能长度，并非实际使用长度，在不损失精确性的前提下，长度越短越好
rows：MySQL认为必须要执行查询的行数，在innodb引擎的表中，是一个估计值，可能并不总是准确的
filtered：表示返回结果的行数占需读取行数的百分比，filtered 的值越大越好。