当前位置: 首页 > article >正文

数据库MVCC详解

MVCC

1.基本介绍

数据库:MySQL。【很多主流数据库都使用了MVCC,比如MySQL的InnoDB引擎、PostgreSQL、Oracle】

MVCC,全称Multi-Version Concurrency Control,即多版本并发控制。是数据库管理系统中的一种并发控制方法。

MVCC的基本原理: 它通过保存数据的历史版本来实现,这样读操作不会被写操作阻塞,写操作也不会被读操作阻塞。这样的话,提高了并发性能。比如说,当一个事务开始读取数据时,它会看到数据库在某个时间点的快照,之后即使其他事务修改了数据,这个事务看到的还是旧版本的数据,直到它提交或者回滚。

不同的隔离级别(如读已提交、可重复读、串行化)在MVCC中的实现方式不同。例如,在读已提交级别下,每次读取都会获取最新的快照,而可重复读则是在事务开始时确定快照,后续读取都基于这个快照,从而避免不可重复读的问题。

  • 当前读和快照读
  • 当前读:像select lock in share mode(共享锁), select for update ; update, insert ,delete(排他锁)这些操作都是一种当前读,为什么叫当前读?就是它读取的是记录的最新版本,读取时还要保证其他并发事务不能修改当前记录,会对读取的记录进行加锁。
  • 快照读:像不加锁的select操作就是快照读,即不加锁的非阻塞读;快照读的前提是隔离级别不是串行级别,串行级别下的快照读会退化成当前读;之所以出现快照读的情况,是基于提高并发性能的考虑,快照读的实现是基于多版本并发控制,即MVCC,可以认为MVCC是行锁的一个变种,但它在很多情况下,避免了加锁操作,降低了开销;既然是基于多版本,即快照读可能读到的并不一定是数据的最新版本,而有可能是之前的历史版本

MVCC就是为了实现读-写冲突不加锁,而这个读指的就是快照读, 而非当前读,当前读实际上是一种加锁的操作,是悲观锁的实现

当前读 <==> 悲观锁; 快照读 <=> 乐观锁?

2.mvcc实现原理

数据库不知道的秘密。

每行记录除了我们自定义的字段外,还有数据库隐式定义的DB_TRX_ID,DB_ROLL_PTR,DB_ROW_ID等字段

  • DB_TRX_ID:6byte,最近修改(修改/插入)事务ID:记录创建这条记录/最后一次修改该记录的事务ID ---------【事务ID
  • DB_ROLL_PTR:7byte,回滚指针,指向这条记录的上一个版本(存储于rollback segment里) -----------------【回滚指针
  • DB_ROW_ID:6byte,隐含的自增ID(隐藏主键),如果数据表没有主键,InnoDB会自动以DB_ROW_ID产生一个聚簇索引 ----------【隐藏主键
  • 实际还有一个删除flag隐藏字段, 既记录被更新或删除并不代表真的删除,而是删除flag变了 --------【删除标记】

① MVCC 核心机制

  • 版本链:每行数据通过隐藏字段 DB_TRX_ID(事务ID)和 DB_ROLL_PTR(回滚指针)维护多个版本。
  • ReadView:事务启动时生成一个“快照”,记录当前活跃事务的 ID 列表,用于判断数据版本的可见性。
  • 事务隔离级别:不同隔离级别下,ReadView 的生成规则不同(例如“读已提交”每次读都生成新快照,“可重复读”使用事务启动时的快照)。

②示例

有这样一张表,里面有记录。

idnameageDB_TRX_IDDB_ROLL_PTR
1Alice251000x0000

初始版本由事务 txid=100 提交生成;DB_ROLL_PTR 指向旧版本(初始为 NULL)。

这个时候有两个事务来了。

  • 事务A(txid=200):执行 UPDATE user SET age=26 WHERE id=1
  • 事务B(txid=201):在事务A提交前,执行 SELECT * FROM user WHERE id=1

事务A 更新数据,InnoDB引擎,会为这行数据创建一个新版本,并修改 DB_TRX_ID=200DB_ROLL_PTR 指向旧版本(事务100提交的版本)。

这个时候,还没有A事务还没有提交,新版本(V2)还未提交,旧版本(V1)仍然存在。

id | name  | age | DB_TRX_ID | DB_ROLL_PTR     【这个是新版本V2】
---|-------|-----|-----------|------------
1  | Alice | 26  | 200       | 0x1234(指向旧版本V1)
                                 丨丨
                                 丨丨
                                  ↓

id | name  | age | DB_TRX_ID | DB_ROLL_PTR     【这个是旧版本V1】
---|-------|-----|-----------|------------
1  | Alice | 25  | 100       | 0x0000

然后,事务B读取数据,事务B 启动时会生成一个 ReadView,记录当前活跃事务的 ID 列表。假设此时只有事务A(txid=200)未提交,活跃事务列表为 [200]

事务B 根据 ReadView 判断数据版本的可见性:

  • 规则:若数据版本的 DB_TRX_ID 小于当前事务的 txid,且该事务已提交,则可见。
  • 当前数据最新版本是 V2(DB_TRX_ID=200),但事务B 的 ReadView 显示 txid=200 是活跃的(未提交),因此 V2 不可见。
  • 事务B 沿着回滚指针(DB_ROLL_PTR)找到旧版本 V1(DB_TRX_ID=100),判断 100 < 201 且已提交,因此返回 V1 的数据:

故,事务B读到的如下:

id | name  | age 
---|-------|-----
1  | Alice | 26  

可以看到上述读写,好像没有加锁。。

③可见性规则

InnoDB 判断数据版本是否可见的逻辑如下:

  1. 如果数据版本的 DB_TRX_ID 小于当前事务的 txid该事务已提交 → 可见,【怎么看提交了没有呢?看事务的活跃列表】。
  2. 如果数据版本的 DB_TRX_ID 等于当前事务的 txid → 可见(事务可以看到自己的修改)。
  3. 如果数据版本的 DB_TRX_ID 大于当前事务的 txid → 不可见(属于未来的修改)。
  4. 如果数据版本的 DB_TRX_ID 在事务的 ReadView 活跃列表中 → 不可见(该事务尚未提交)。

MVCC 通过维护数据多版本和 ReadView 机制,实现读写不阻塞和高并发:

  1. 写操作:生成新版本,不影响其他事务的读操作。
  2. 读操作:基于快照读取旧版本,无需加锁。
  3. 提交后的版本:对新事务可见,旧事务仍看到历史版本。

这种机制在保证事务隔离性的同时,极大提升了数据库并发性能。

3.补充知识点

MySQL 中的 undo logredo logbinlog 是三种核心日志,各自承担不同的职责,共同保障数据库的事务性、持久性和高可用性

下面三个是参考deepseek的解释。

① Undo Log(回滚日志)

作用

  • 事务回滚:记录数据修改前的旧值,用于事务回滚时恢复原始数据。
  • MVCC(多版本并发控制):提供历史版本数据,支持一致性非锁定读(Consistent Non-locking Read)。

工作机制

  • 当执行 INSERTUPDATEDELETE 时,InnoDB 会将修改前的数据保存到 undo log。
  • 事务回滚:通过 undo log 逆向操作,恢复数据到修改前的状态。
  • MVCC 实现:其他事务读取数据时,若当前版本不可见(如未提交),则通过 undo log 找到可见的历史版本。

见上面的mvcc。

② Binlog(二进制日志)

作用

  • 主从复制:记录所有数据库修改操作,用于主库到从库的数据同步。
  • 数据恢复:支持按时间点恢复数据(Point-in-Time Recovery, PITR)。

工作机制

  • 逻辑日志:记录 SQL 语句或行的逻辑变化(取决于 binlog_formatSTATEMENTROWMIXED)。
  • 写入时机:事务提交后写入 binlog(与 redo log 不同)。
  • 刷盘控制:由 sync_binlog 参数控制刷盘频率。

我来举个例子:

-- 事务C: 删除一行数据
BEGIN;
DELETE FROM users WHERE id = 1;
COMMIT;

-- 提交后,binlog 记录该 DELETE 语句(或行变化)。从库读取 binlog 并重放,保持数据一致性。

③ Redo Log(重做日志)

作用

  • 崩溃恢复:确保事务的持久性(Durability)。即使数据库崩溃,已提交的事务修改不会丢失。
  • Write-Ahead Logging (WAL):修改数据前,先记录重做日志到磁盘

工作机制

  • 事务提交时,先将所有修改的物理页变化记录到 redo log(顺序写入,性能高)。
  • 刷盘策略:由 innodb_flush_log_at_trx_commit 控制:
    • 1(默认):每次提交都刷盘,保证崩溃恢复不丢数据。
    • 02:延迟刷盘,性能更高但可能丢失部分数据。
  • 崩溃恢复:重启后,通过 redo log 重放未写入数据文件的修改。

我来举个例子:

-- 事务B: 插入一条新数据
BEGIN;
INSERT INTO users (id, name) VALUES (2, 'Bob');
COMMIT; 

-- 提交时,redo log 记录插入操作的物理页修改,之后数据可能还未写入磁盘。
-- 若此时崩溃,重启后根据 redo log 恢复该插入操作。

以更新操作为例子:

  1. 事务执行:修改数据前,将旧值记录在undo log;最终还是要修改磁盘数据的,还记录一下修改的物理页位置 redo log
  2. 事务提交:redo log标记为prepare 状态并刷盘。 写入 binlog 并刷盘。将 redo log 标记为 commit 状态(两阶段提交,保证一致性)。
  3. 崩溃恢复: 若崩溃发生在 binlog 写入前,事务回滚(通过 undo log)。 若 binlog 已写入,则根据 redo log 重放修改。

1. 为什么需要 redo log 和 binlog 两种日志?

  • redo log 是 InnoDB 引擎层的物理日志,保证崩溃恢复和持久性。
  • binlog 是 MySQL Server 层的逻辑日志,支持主从复制和跨引擎数据恢复。
  • 二者结合通过“两阶段提交”确保数据一致性。

2. undo log 会被删除吗?

  • 当事务提交且没有其他事务需要访问旧版本数据时,undo log 可以被清理。
  • 长事务可能导致 undo log 堆积(“版本膨胀”),影响性能。

3. binlog 和 redo log 的写入顺序?

  • 事务提交时,先写 redo log(prepare) → 再写 binlog → 最后写 redo log(commit)。

  • 这是为了确保崩溃恢复时,binlog 和 redo log 的一致性(两阶段提交)。

  • undo log:保障事务的原子性和 MVCC。

  • redo log:保障事务的持久性和崩溃恢复。

  • binlog:保障数据可复制性和逻辑恢复。

end.参考

参考:https://www.cnblogs.com/jelly12345/p/14889331.html


http://www.kler.cn/a/597934.html

相关文章:

  • python 数据可视化mayavi库安装与使用
  • leetcode_双指针 15.三数之和
  • 【js逆向】某酒店模拟登录
  • Python 正则表达式超详细解析:从基础到精通
  • 【漫话机器学习系列】157.饱和(Saturation)
  • ffmpeg介绍(一)——解封装
  • 【跟着灵神刷力扣】定长滑动窗口
  • 【基于ROS的A*算法实现路径规划】A* | ROS | 路径规划 | Python
  • 通往自主智能之路:探索自我成长的AI
  • Linux信号的诞生与归宿:内核如何管理信号的生成、阻塞和递达?
  • 虚拟机安装centos7
  • 【RAGFlow】全由国内镜像源搭建docker版
  • SAP-ABAP:SAP BW模块架构与实战应用详解
  • 【 <二> 丹方改良:Spring 时代的 JavaWeb】之 Spring Boot 中的数据验证:使用 Hibernate Validator
  • 蓝桥杯备考:动态规划之最长上升子序列打鼹鼠
  • 自动驾驶背后的数学:多模态传感器融合的简单建模
  • python接口自动化pytest+request+allure
  • Python实现deepseek接口的调用
  • C语言入门教程100讲(13)其他运算符
  • 2025年了,5G还有三个新变化