深入剖析MySQL数据库架构:核心组件、存储引擎与优化策略(一)
sql语句分为两大类:查询(select)、增删改----修改(update)
select语句的执行流程
执行sql语句的流程:连接数据库、缓存查询、解析器、优化器、执行器、存储引擎操作数据
客户端:图形界面工具,cmd窗口,Java代码。
先在缓存中查,MySQL缓存中的key是sql语句,sql语句多加一个空格之前的缓存就不能使用了。一般不使用mysql缓存,一般使用mybatis的一级缓存、二级缓存。
连接层
当mysql服务器启动(mysql服务器就是一个进程),等待客户端连接,每一个客户的连接请求,服务器都会创建一个新的线程处理(如果是线程池的话,则是分配一个空的线程),每个线程都是独立的,拥有各自的内存处理空间。
使用客户端(程序、客户端图形界面工具)访问mysql数据,第一步是连接上mysql的服务器。
1) 协议问题
连接所使用的协议。大多数是TCP协议,也可以使用其他的协议,例如:unix socket(了解即可)
2) 连接问题
连接可以是长连接也可以是短连接,短连接的特点是连接后立即关闭,比较消耗资源。长连接使用后不会立即释放,可以给其他的客户端继续使用,所以mysql大多数都是使用的长连接。
3) 同步问题
Mysql支持同步和异步的方式,大多数使用的是同步的方式,异步会给编程带来复杂性。执行完一条SQL语句再执行下一句SQL语句-----同步
同步:当一个任务未完成,下一个任务无法开始
异步:异步任务可以独立执行
4) 通过命令查看mysql服务器端连接相关的默认配置
show global status like'Thread%';
(查看mysql服务器端目前所创建立的连接 mysql属于一个进程 每一个连接为一个线程)
连接在指定超时的时间后,会更新销毁。利用如下的命令可以查看。
-- 非交互式超时时间,例如:JDBC程序方式连接
show GLOBAL VARIABLES like'wait_timeout';
-- 交互式超时时间,如客户端工具
show GLOBAL VARIABLES like'interactive_timeout';
Mysql数据库默认支持的并发连接数量,默认值是151,是可以修改的。
-- 显示默认的最大并发连接数(最大并发连接数指的是数据库能够同时连接的人数)
show VARIABLES like'max_connections';
特别注意:
加了 Global 的命令是查看全局的参数,没有加是查看当前会话级别的参数。如果想设置全局的,需要修改mysql的配置文件。Linux系统下修改 /etc/my.cnf配置文件,windows下修改my.ini的配置文件。
缓存层
Mysql数据库中支持缓存,在5.7的版本中默认是关闭状态(在8的版本中已经去掉了mysql的缓存)。可以通过查看缓存相关的命令查看。
-- 查询mysql缓存
show VARIABLES like'query_cache%';
在mysql的配置文件my.ini或my.cnf中也可以找到缓存相关的配置,默认都是关闭的。
query_cache_size=0
以上信息是默认配置,其注释意思是说,MYSQL的查询缓存用于缓存select查询结果,并在下次接收到同样的查询请求时,不再执行实际查询处理而直接返回结果,有这样的查询缓存能提高查询的速度,使查询性能得到优化,前提条件是你有大量的相同或相似的查询,而很少改变表里的数据,否则没有必要使用此功能。Sql语句的更改(简单到修改了一个空格),都不会查询之前的缓存。表中完成了新增,修改数据缓存也会失效。
如果想使用缓存,具体的配置方法:
1.将query_cache_size设置为具体的大小,具体大小是多少取决于查询的实际情况,但最好设置为1024的倍数,参考值32M。
2.增加一行:query_cache_type=1
query_cache_type参数用于控制缓存的类型,注意这个值不能随便设置,必须设置为数字,可选项目以及说明如下:
如果设置为0,那么可以说,你的缓存根本就没有用,相当于禁用了。
如果设置为1,将会缓存所有的结果,除非你的select语句使用SQL_NO_CACHE禁用了查询缓存。
如果设置为2,则只缓存在select语句中通过SQL_CACHE指定需要缓存的查询
解析层
解析器解析编写的sql语句,根据关键字运算符等生成对应的树形结构。
词法和语法解析:
解析sql语句,生成树形结构。
解析树:
语义解析:判断表名或者字段是否存在,使用的别名是否正确。
例如:select * from xxx xxx表如果不存在,sql语句也会报错。
优化器
编写了一条sql语句,它是有多种执行路径的,只不过最终的执行结果是相同的。多种路径是由哪个组件来生成的,最终选择哪一个路径来执行该sql呢。
Mysql架构中使用优化器来根据解析树生成多条执行路径(执行计划),最终会选择一个执行计划去执行。
执行计划生成后,会选择优化器认为最优的执行计划进行执行。根据cost(成本)方式选择出来的优化器。
优化器还会对sql语句进行优化,例如在进行join多表查询的时候,哪张表先查,那张表后查询会进行优化,当一条sql执行可以使用几个索引,优化器也会选择出一个成本最优的索引使用。像sql语句中存在 1=1 的时候,也是可以把 1=1优化掉的。
如何去查看优化器生成的执行计划,加入explain去执行sql语句即可。
如果想查看更详细的信息,可以显示json的数据格式。
EXPLAIN FORMAT=JSON select* from t_person
Select * from user;
Select * from user where1=1;
执行器
存储器
数据存储在本地磁盘(MySQL的安装目录中Data文件夹中)
存储引擎在MySQL的逻辑架构中位于第三层,负责MySQL中的数据的存储和提取。MySQL存储引擎有很多,不同的存储引擎保存数据和索引的方式是不同的。每一种存储引擎都有它的优势和劣势。
可以使用 show engines; 命令来查看当前数据库所支持的所有的存储引擎。
SHOW VARIABLES LIKE 'default_storage_engine%';-------查看默认存储引擎