当前位置：首页 > article >正文

【入门级教程】MySQL：从零开始的数据库之旅

article 2024/10/28 3:01:22

【入门级教程】MySQL：从零开始的数据库之旅

简介

mysql

你是否对数据库充满好奇，却不知从何入手？你是否想学习如何使用MySQL，却苦于找不到合适的入门教程？别担心，这篇博客将带你从零开始，轻松掌握MySQL的基础知识和操作技巧。

本教程将涵盖以下内容：

SQL语言基础：SELECT、INSERT、UPDATE、DELETE等常用语句。
使用索引提高查询效率。
存储过程。

本教程面向零基础用户，采用通俗易懂的语言和丰富的示例，帮助你快速上手MySQL。无论你是学生、开发者还是对数据库感兴趣的爱好者，这篇博客都将为你打开MySQL的大门，带你开启数据管理的新世界！

摘要：

本教程面向零基础用户，采用通俗易懂的语言和丰富的示例，帮助你快速掌握MySQL的基础知识和操作技巧。内容涵盖SQL语言基础（SELECT、INSERT、UPDATE、DELETE等常用语句）、使用索引提高查询效率、存储过程等。适合学生、开发者及数据库爱好者。

常用SQL

表操作

创建表

创建一个表

DROP TABLE IF EXISTS key_value;
CREATE TABLE key_value(
    _key VARCHAR(255)    COMMENT '键' ,
    _value VARCHAR(255)    COMMENT '值' 
)  COMMENT = '键值对';

增加表字段

ALTER TABLE

给表条件一个字段

ALTER TABLE 表名 ADD `字段名` VARCHAR ( 128 )   COMMENT '备注';

ALTER TABLE t_user ADD `user_name` VARCHAR ( 128 )   COMMENT '用户名称';

增删改

查询和更新指令构成了 SQL 的 DML 部分：

SELECT - 从数据库表中获取数据
UPDATE - 更新数据库表中的数据
DELETE - 从数据库表中删除数据
INSERT INTO - 向数据库表中插入数据

插入一条数据

INSERT INTO 语句

INSERT INTO 语句用于向表格中插入新的行。

//语法：
INSERT INTO 表名称 VALUES (值1, 值2,....)
//我们也可以指定所要插入数据的列：
INSERT INTO table_name (列1, 列2,...) VALUES (值1, 值2,....)

INSERT INTO key_value VALUES ("1","2222");
INSERT INTO key_value (_key,_value) VALUES ("2","键值对");

删除一条数据

DELETE 语句

DELETE 语句用于删除表中的行。

//语法:
DELETE FROM 表名称 WHERE 列名称 = 值

DELETE FROM key_value WHERE _key = "2";
SELECT * FROM key_value;

更新一条数据库

Update 语句

Update 语句用于修改表中的数据。

语法：
UPDATE 表名称 SET 列名称 = 新值 WHERE 列名称 = 某值

UPDATE key_value set _key = "我不想做主键" WHERE _key= "1";
SELECT * from key_value;

查询篇

查询所有数据

现在我们希望从 “Persons” 表中选取所有的列。请使用符号 * 取代列的名称，就像这样：

SELECT * FROM Persons

条件查询： user_id = 123 的数据

SELECT
	tu.id,
	tu.user_name
FROM
	tu.t_user AS tu 
WHERE
	tu.user_id = 123;

条件查询：查询 user_id = 123 或 456 的数据

SELECT
	tu.id,
	tu.user_name
FROM
	t_user AS tu 
WHERE
	tu.user_id = 123
	OR tu.user_id = 456;

查询重复的数据sql

查询重复的数据可以使用SQL中的GROUP BY和HAVING子句。以下是一个示例查询，可以检查名为table_name的表中是否有重复的column_name列的值：

SELECT
	column_name,
	COUNT(*) 
FROM
	table_name 
GROUP BY
	column_name 
HAVING
	COUNT(*) > 1;

该查询将按照column_name列的值进行分组，并计算每个值的出现次数。然后使用HAVING子句过滤出现次数大于1的组，这些组中的行即为重复数据。

请注意，上述查询仅检查一个列的重复数据。如果您想要检查多个列的组合是否重复，请在GROUP BY子句中包含这些列的名称。例如：

SELECT
	column_name1,
	column_name2,
	COUNT(*) 
FROM
	table_name 
GROUP BY
	column_name1,
	column_name2 
HAVING
	COUNT(*) > 1;

该查询将按照column_name1和column_name2列的值进行分组，并计算每个组的出现次数。然后使用HAVING子句过滤出现次数大于1的组，这些组中的行即为重复数据。

模糊查询

select * from chihiro_area;
SELECT * FROM `chihiro_area` WHERE 1=1 and name LIKE '%北';
SELECT name,area_code FROM chihiro_area WHERE 1=1 and area_code LIKE '11%';
select * from chihiro_area where parent_code  LIKE '1100%';
select * from chihiro_area WHERE name LIKE '北京%';

联查

SELECT * from sys_user;
SELECT * from sys_dept;

select 
	su.dept_id,
	su.user_name,
	sd.dept_name,
	sd.email 
from sys_user AS su 
INNER JOIN sys_dept AS sd ON su.dept_id = sd.dept_id;

存储过程

利用生成假数据

创建存储过程

delimiter //
create procedure batchInsert()
begin
    declare num int; 
    set num=1;
    while num<=1000000 do
        insert into key_value(`username`,
    `password`) values(concat('测试用户', num),
        '123456');
        set num=num+1;
    end while;
end
// 
delimiter ; #恢复;表示结束

调用存储过程

写好了存储过程就可以进行调用了，可以通过命令调用：

CALL batchInsert;

也可以在数据库工具的中Functions的栏目下，找到刚刚创建的存储过程直接执行。

删除存储过程

drop procedure batchInsert;

索引-理论篇

存储方式区分

MySQL 索引可以从存储方式、逻辑角度和实际使用的角度来进行分类。
根据存储方式的不同，MySQL 中常用的索引在物理上分为 B-树索引和HASH索引两类，两种不同类型的索引各有其不同的适用范围。

B-树索引：BTREE

B-树索引又称为 BTREE 索引，目前大部分的索引都是采用 B-树索引来存储的。
B-树索引是一个典型的数据结构，其包含的组件主要有以下几个。

叶子节点：包含的条目直接指向表里的数据行。叶子节点之间彼此相连，一个叶子节点有一个指向下一个叶子节点的指针。

分支节点：包含的条目指向索引里其他的分支节点或者叶子节点。

根节点：一个 B-树索引只有一个根节点，实际上就是位于树的最顶端的分支节点。

基于这种树形数据结构，表中的每一行都会在索引上有一个对应值。因此，在表中进行数据查询时，可以根据索引值一步一步定位到数据所在的行。

B-树索引可以进行全键值、键值范围和键值前缀查询，也可以对查询结果进行 ORDER BY 排序。但 B-树索引必须遵循左边前缀原则，要考虑以下几点约束：

查询必须从索引的最左边的列开始。
查询不能跳过某一索引列，必须按照从左到右的顺序进行匹配。
存储引擎不能使用索引中范围条件右边的列。

哈希索引：Hash

哈希（Hash）一般翻译为“散列”，也有直接音译成“哈希”的，就是把任意长度的输入（又叫作预映射，pre-image）通过散列算法变换成固定长度的输出，该输出就是散列值。
哈希索引也称为散列索引或 HASH 索引。MySQL 目前仅有 MEMORY 存储引擎和 HEAP 存储引擎支持这类索引。其中，MEMORY 存储引擎可以支持 B-树索引和 HASH 索引，且将 HASH 当成默认索引。
HASH 索引不是基于树形的数据结构查找数据，而是根据索引列对应的哈希值的方法获取表的记录行。哈希索引的最大特点是访问速度快，但也存在下面的一些缺点：

MySQL 需要读取表中索引列的值来参与散列计算，散列计算是一个比较耗时的操作。也就是说，相对于 B-树索引来说，建立哈希索引会耗费更多的时间。
不能使用 HASH 索引排序。
HASH 索引只支持等值比较，如“=”“IN()”或“<=>”。
HASH 索引不支持键的部分匹配，因为在计算 HASH 值的时候是通过整个索引值来计算的。

逻辑区分

根据索引的具体用途，MySQL 中的索引在逻辑上分为以下五类

普通索引：INDEX
唯一索引：UNIQUE
主键索引：PRIMARY KEY
空间索引：SPATIAL
全文索引：FULLTEXT

普通索引：INDEX

普通索引是 MySQL 中最基本的索引类型，它没有任何限制，唯一任务就是加快系统对数据的访问速度。
普通索引允许在定义索引的列中插入重复值和空值。
创建普通索引时，通常使用的关键字是 INDEX 或 KEY。

基本语法如下：

CREATE INDEX index_id 
ON my_chihiro(id);

唯一索引：UNIQUE

唯一索引与普通索引类似，不同的是唯一索引不仅用于提高性能，而且还用于数据完整性，唯一索引不允许将任何重复的值插入表中
唯一索引列的值必须唯一，允许有空值。
如果是组合索引，则列值的组合必须唯一。
创建唯一索引通常使用 UNIQUE 关键字。

基本语法如下：

CREATE UNIQUE INDEX index_id 
ON my_chihiro(id);

主键索引：PRIMARY KEY

主键索引就是专门为主键字段创建的索引，也属于索引的一种。
主键索引是一种特殊的唯一索引，不允许值重复或者值为空。
创建主键索引通常使用 PRIMARY KEY 关键字。不能使用 CREATE INDEX 语句创建主键索引。

空间索引：SPATIAL

空间索引是对空间数据类型的字段建立的索引，使用 SPATIAL 关键字进行扩展。
创建空间索引的列必须将其声明为 NOT NULL，空间索引只能在存储引擎为 MyISAM 的表中创建。
空间索引主要用于地理空间数据类型 GEOMETRY。

基本语法如下：my_chihiro 表的存储引擎必须是 MyISAM，line 字段必须为空间数据类型，而且是非空的。

CREATE SPATIAL INDEX index_line
ON my_chihiro(line);

全文索引：FULLTEXT

全文索引主要用来查找文本中的关键字，只能在 CHAR、VARCHAR 或 TEXT 类型的列上创建。在 MySQL 中只有 MyISAM 存储引擎支持全文索引。
全文索引允许在索引列中插入重复值和空值。
不过对于大容量的数据表，生成全文索引非常消耗时间和硬盘空间。

基本语法如下：index_info 的存储引擎必须是 MyISAM，info 字段必须是 CHAR、VARCHAR 和 TEXT。

CREATE FULLTEXT INDEX index_info
ON my_chihiro(info);

实际使用

在实际应用中，索引通常分为

单列索引
复合索引/多列索引/组合索引

单列索引

单列索引就是索引只包含原表的一个列。在表中的单个字段上创建索引，单列索引只根据该字段进行索引。
单列索引可以是普通索引，也可以是唯一性索引，还可以是全文索引。只要保证该索引只对应一个字段即可。

基本语法如下：address 字段的数据类型为 VARCHAR(20)，索引的数据类型为 CHAR(6)，查询时可以只查询 address 字段的前 6 个字符，而不需要全部查询。

CREATE INDEX index_addr 
ON my_chihiro(address(6));

多列索引/复合索引

组合索引也称为复合索引或多列索引。
相对于单列索引来说，组合索引是将原表的多个列共同组成一个索引。
多列索引是在表的多个字段上创建一个索引。该索引指向创建时对应的多个字段，可以通过这几个字段进行查询。
注意只有查询条件中使用了这些字段中第一个字段时，索引才会被使用。

基本语法如下：索引创建好了以后，查询条件中必须有 name 字段才能使用索引

CREATE INDEX index_na 
ON tb_student(name,address);

无论是创建单列索引还是复合索引，都应考虑在查询的WHERE子句中可能经常使用的列作为过滤条件。
如果仅使用一列，则应选择单列索引，如果在WHERE子句中经常使用两个或多个列作为过滤器，则复合索引将是最佳选择。

一个表可以有多个单列索引，但这些索引不是组合索引。

一个组合索引实质上为表的查询提供了多个索引，以此来加快查询速度。比如，在一个表中创建了一个组合索引(c1，c2，c3)，在实际查询中，系统用来实际加速的索引有三个：单个索引(c1)、双列索引(c1，c2)和多列索引(c1，c2，c3)。

删除索引

DROP INDEX命令，可以使用SQL DROP 命令删除索引，删除索引时应小心，因为性能可能会降低或提高。

基本语法如下：

DROP INDEX index_name;

索引-实践篇

增删查

添加索引

alter table chihiro_member_info add index idx_name (name);

查看索引

SHOW INDEX FROM chihiro_member_info;

删除索引

DROP INDEX <索引名> ON <表名>
DROP INDEX idx_name ON chihiro_member_info;

索引失效

有时候我们明明加了索引了，但是索引却不生效。在哪些场景，索引会不生效呢？主要有以下十大经典场景：

一、隐式的类型转换，索引失效

我们有一个索引，字段（name）类型为varchar字符串类型，如果查询条件传了一个数字去，会导致索引失效。

EXPLAIN SELECT *	FROM chihiro_member_info WHERE name = 1;

如果给数字加上’'，也就是说，传的是一个字符串，就正常走索引。

EXPLAIN SELECT *	FROM chihiro_member_info WHERE name = 1;

分析：为什么第一条语句未加单引号就不走索引了呢？这是因为不加单引号时，是字符串跟数字的比较，它们类型不匹配，MySQL会做隐式的类型转换，把它们转换为浮点数再做比较。隐式的类型转换，索引会失效。

二、查询条件包含or，可能导致索引失效

我们在来看一条sql语句，name添加了索引，但是openid没有添加索引。我们使用or，下面的sql是不走索引的。

EXPLAIN SELECT *	FROM chihiro_member_info WHERE name = "123" or openid = "123";

分析：对于 or+没有索引的openid这种情况，假设它走 name的索引，但是走到 openid查询条件时，它还得全表扫描，也就是需要三步过程： 全表扫描+索引扫描+合并。如果它一开始就走全表扫描，直接一遍扫描就完事。Mysql优化器处于效率与成本考虑，遇到 or条件，让索引失效。

当 name和role都是索引时，使用一张表中的多个索引时，mysql会将多个索引合并在一起。

EXPLAIN SELECT * FROM chihiro_member_info WHERE name = "123" or role = "123";

注意：如果or条件的列都加了索引，**索引可能会走也可能不走，**大家可以自己试一试哈。但是平时大家使用的时候，还是要注意一下这个or，学会用explain分析。遇到不走索引的时候，考虑拆开两条SQL。

三、like通配符可能导致索引失效

并不是用了 like通配符索引一定会失效，而是 like查询是以 %开头，才会导致索引失效。

EXPLAIN SELECT * FROM chihiro_member_info WHERE name LIKE '%陈';

把 %放到后面，索引还是正常走的。

EXPLAIN SELECT * FROM chihiro_member_info WHERE name LIKE '陈%';

分析：既然 like查询以 %开头，会导致索引失效。我们如何优化？

使用覆盖索。
把 %放后面。

四、查询条件不满足联合索引的最左匹配原则

Mysql建立联合索引时，会遵循左前缀匹配原则，既最左优先。如果你建立一个（a,b,c）的联合索引，相当于简历了(a)、(a,b)、(a,b,c)。

我们先添加一个联合索引：

alter table chihiro_member_info add index idx_name_role_openid (name,role,openid);

查看表的索引：

SHOW INDEX FROM chihiro_member_info;

有一个联合索引idx_name_role_openid，我们执行这个SQL，查询条件是role，索引是无效：

EXPLAIN SELECT * FROM chihiro_member_info WHERE role = 0;

在联合索引中，查询条件满足最左匹配原则时，索引才正常生效。

EXPLAIN SELECT * FROM chihiro_member_info WHERE name = "刘";

五、在索引列上使用mysql的内置函数

我们先给创建时间添加一个索引。

ALTER TABLE chihiro_member_info ADD INDEX idx_create_time(create_time);

虽然create_time加了索引，但是因为使用了mysql的内置函数DATE_ADD()，导致直接全表扫描了。

EXPLAIN SELECT * FROM chihiro_member_info WHERE DATE_ADD(create_time,INTERVAL 1 DAY) = '2022-10-10 00:00:00';

分析：一般这种情况怎么优化呢？可以把**内置函数的逻辑转移到右边，**如下：

EXPLAIN SELECT * FROM chihiro_member_info WHERE create_time = DATE_ADD('2022-10-10 00:00:00',INTERVAL -1 DAY);

六、对索引进行列运算（如，+、-、*、/）,索引不生效

给 role字段（tinyint）添加一个索引。

-- 添加索引
ALTER TABLE chihiro_member_info ADD INDEX idex_role(role);

虽然role加了索引，但是因为它进行运算，索引直接迷路了。如图：

EXPLAIN SELECT * FROM chihiro_member_info WHERE role+1 = 1;

分析：不可以对索引列进行运算，可以在代码处理好，再传参进去。

七、索引字段上使用（！= 或者 < >），索引可能失效

给 role字段（tinyint）添加一个索引。

-- 添加索引
ALTER TABLE chihiro_member_info ADD INDEX idex_role(role);

注意：我在mysql 5.7.26测试，测试结果有所不同，可以根据mysql版本去测试。

查看mysql版本

SELECT VERSION() FROM DUAL;

!=：正常走的索引。

EXPLAIN SELECT * FROM chihiro_member_info WHERE role != 2;

<>：正常走的索引。

EXPLAIN SELECT * FROM chihiro_member_info WHERE role <> 2;

分析：其实这个也是跟mySQL优化器有关，如果优化器觉得即使走了索引，还是需要扫描很多很多行的哈，它觉得不划算，**不如直接不走索引。**平时我们用！= 或者< >，not in的时候，可以先使用 EXPLAIN去看看索引是否生效。

八、索引字段上使用is null， is not null，索引可能失效

给 role字段（tinyint）添加一个索引和 name字段（varchar）添加索引。

-- 添加索引
ALTER TABLE chihiro_member_info ADD INDEX idex_role(role);
ALTER TABLE chihiro_member_info ADD INDEX idex_name(name);

单个字段 role字段加上索引，查询 role 为空的语句，会走索引：

EXPLAIN SELECT * FROM chihiro_member_info WHERE role is not null;

两字字段用 or链接起来，索引就失效了。

分析：很多时候，也是因为数据量问题，导致了MySQL优化器放弃走索引。同时，平时我们用explain分析SQL的时候，如果type=range，需要注意一下，因为这个可能因为数据量问题，导致索引无效。

九、左右连接，关联的字段编码格式不一样

新建两个表，一个user，一个user_job：

CREATE TABLE `user` (
  `id` int(11) NOT NULL AUTO_INCREMENT,
  `name` varchar(255) CHARACTER SET utf8mb4 DEFAULT NULL,
  `age` int(11) NOT NULL,
  PRIMARY KEY (`id`),
  KEY `idx_name` (`name`) USING BTREE
) ENGINE=InnoDB AUTO_INCREMENT=2 DEFAULT CHARSET=utf8;

CREATE TABLE `user_job` (
  `id` int(11) NOT NULL,
  `userId` int(11) NOT NULL,
  `job` varchar(255) DEFAULT NULL,
  `name` varchar(255) DEFAULT NULL,
  PRIMARY KEY (`id`),
  KEY `idx_name` (`name`) USING BTREE
) ENGINE=InnoDB DEFAULT CHARSET=utf8;

user表的name字段编码是utf8mb4，而user_job表的name字段编码为utf8。

执行左外连接查询，user_job表还是走全表扫描。

如果把它们的name字段改为编码一致，相同的SQL，还是会走索引。

分析：所以大家在做表关联时，注意一下关联字段的编码问题。

十、优化器选错了索引

MySQL 中一张表是可以支持多个索引的。你写SQL语句的时候，没有主动指定使用哪个索引的话，用哪个索引是由MySQL来确定的。

我们日常开发中，不断地删除历史数据和新增数据的场景，有可能会导致MySQL选错索引。那么有哪些解决方案呢？

使用force index 强行选择某个索引；
修改你的SQl，引导它使用我们期望的索引；
优化你的业务逻辑；
优化你的索引，新建一个更合适的索引，或者删除误用的索引。

3.3 索引速度对比

测试数据量量400万，字段包含：id、username、password

-- 数据量量400万，字段包含：id、username、password

-- 没有索引下查询
SELECT * FROM key_value;

select * from key_value WHERE username = '测试用户388888'
-- > OK
-- > 时间: 1.496s

select * from key_value WHERE username = '测试用户388888'
-- > OK
-- > 时间: 1.503s

select * from key_value WHERE username = '测试用户388888'
-- > OK
-- > 时间: 1.475s

-- 创建索引后：
SELECT * from key_value WHERE username = '测试用户388888';

SELECT * from key_value WHERE username = '测试用户388888'
-- > OK
-- > 时间: 0.005s

SELECT * from key_value WHERE username = '测试用户3588828';
-- > OK
-- > 时间: 0.005s

-- 测试查找主键id 
-- 主键也是有索引的是，所以非常快
SELECT * from key_value WHERE id = 123333;
-- > OK
-- > 时间: 0.004s

查看全文

http://www.kler.cn/news/368125.html