当前位置: 首页 > article >正文

数据库事务的 ACID,通过MVCC能做什么

数据库事务的 ACID 特性

原子性 (Atomicity):事务内的操作要么全部成功,要么全部回滚。
一致性 (Consistency):事务执行后数据库保持逻辑完整性(约束、业务规则)。
隔离性 (Isolation):事务并发执行时互不干扰。
持久性 (Durability):事务提交后修改永久有效。

事务并发问题
在并发场景下,若隔离性不足,可能引发以下问题:
脏读 (Dirty Read):事务 A 读取了事务 B 未提交的修改。
不可重复读 (Non-Repeatable Read):事务 A 多次读取同一数据,结果不一致(因事务 B 修改了该数据并提交)。
幻读 (Phantom Read):事务 A 多次查询同一条件,结果集的行数变化(因事务 B 插入或删除了符合条件的数据并提交)。

MVCC 如何解决这些问题?

MVCC(Multi-Version Concurrency Control,多版本并发控制) 是一种通过维护数据的多个版本来实现无锁并发控制的机制。它通过以下方式解决脏读、不可重复读和幻读:

1. MVCC 的核心原理

数据版本快照:每个事务启动时,会生成一个一致性视图(Read View),记录当前活跃事务的 ID 列表。
版本链:每条数据行保存多个版本,通过 DB_TRX_ID(事务 ID)和 DB_ROLL_PTR(回滚指针)链接到历史版本。
可见性规则:事务只能看到在它启动前已提交的版本,或由自身修改的版本。

2. 解决脏读

问题场景:
事务 B 修改数据但未提交,事务 A 读取了该未提交的脏数据。
MVCC 的解决方案:
事务 A 读取数据时,根据其 Read View 判断数据版本的可见性。
若数据版本对应的事务(事务 B)未提交,则沿着版本链找到已提交的最新版本。
结果:事务 A 读取的是事务 B 修改前的已提交版本,避免脏读。

3. 解决不可重复读

问题场景:
事务 A 第一次读取数据后,事务 B 修改并提交了该数据,事务 A 再次读取时结果不一致。
MVCC 的解决方案:
在 可重复读(Repeatable Read) 隔离级别下,事务 A 的 Read View 在第一次查询时生成,后续所有读取都基于此视图。
即使事务 B 提交了新版本,事务 A 仍通过版本链读取旧版本数据。
结果:事务 A 多次读取同一数据的结果一致,避免不可重复读。

4. 解决幻读

问题场景:
事务 A 根据条件查询得到结果集,事务 B 插入或删除符合条件的数据并提交,事务 A 再次查询时结果集行数变化。

MVCC 的解决方案:
可重复读(RR)隔离级别下:
快照读(普通 SELECT):事务 A 基于一致性视图读取数据,其他事务插入的新数据对其不可见,避免幻读。
当前读(SELECT FOR UPDATE 或 UPDATE/DELETE):通过 间隙锁(Gap Lock) 锁定范围,阻止其他事务插入符合条件的数据。
读已提交(RC)隔离级别下:
MVCC 仅解决部分幻读问题,但可能因其他事务插入新数据导致幻读。

MVCC 的具体实现(以 MySQL InnoDB 为例)

1. 隐藏字段

每条记录包含以下隐藏字段:
DB_TRX_ID:最后修改该数据的事务 ID。
DB_ROLL_PTR:指向 Undo Log 中旧版本数据的指针。
DB_ROW_ID:行唯一标识(隐式主键)。

2. Undo Log

存储数据的历史版本,形成版本链。
事务回滚时,通过 Undo Log 恢复数据。

3. Read View

包含以下信息:
trx_ids:当前活跃事务 ID 列表。
low_limit_id:生成 Read View 时系统尚未分配的最小事务 ID。
up_limit_id:生成 Read View 时系统已分配的最大事务 ID。

判断数据版本可见性的规则:
若数据版本的 DB_TRX_ID < up_limit_id,说明该版本在事务启动前已提交,可见。
若 DB_TRX_ID >= low_limit_id,说明该版本在事务启动后生成,不可见。
若 DB_TRX_ID 在 trx_ids 列表中且未提交,不可见;否则可见。

MVCC 的隔离级别支持

隔离级别脏读不可重复读幻读实现机制
读未提交 (RU)无 MVCC,直接读最新数据
读已提交 (RC)每次查询生成新 Read View
可重复读 (RR)✅ 部分✅(快照读)事务内复用同一 Read View + 间隙锁
串行化 (S)完全依赖锁机制

MVCC 的优缺点

优点
高并发:读操作不阻塞写操作,写操作不阻塞读操作。
避免锁竞争:通过版本链实现无锁读取,提升性能。
支持快照读:提供一致性视图,简化业务逻辑。

缺点
存储开销:需维护多版本数据和 Undo Log。
历史版本清理:需定期清理过期版本(如 MySQL 的 Purge 线程)。
无法完全消除幻读:在 RR 级别下,当前读仍需间隙锁配合。

总结

MVCC 核心:通过多版本和一致性视图实现无锁并发控制。
解决脏读:只读取已提交的版本。
解决不可重复读:事务内复用同一 Read View。
解决幻读:快照读通过版本控制,当前读通过间隙锁。
适用场景:读多写少的高并发系统(如电商、社交平台)。
通过 MVCC,数据库在保证 ACID 特性的同时,显著提升了并发性能,是现代关系型数据库(如 MySQL、PostgreSQL)的核心并发控制机制。


http://www.kler.cn/a/576945.html

相关文章:

  • 线程的常见使用方法
  • K8S学习之基础十七:k8s的蓝绿部署
  • 分布式光伏发电的发展现状与前景
  • 【多模态感知的神经科学启示】
  • 手写识别革命:Manus AI如何攻克多语言混合识别难题(二)
  • deepin安装rust
  • 2025-03-08 学习记录--C/C++-PTA 习题10-2 递归求阶乘和
  • docker指令整理
  • 图片分类实战:食物分类问题(含半监督)
  • 【统计至简】【入门测试3】协方差矩阵的Cholesky分解
  • Qwen架构与Llama架构的核心区别
  • Sass进阶之路:@forward 的可见性控制与变量覆盖
  • Linux 配置静态 IP
  • spring websocket 介绍
  • create_react_agent(model, tools) 和 graph_builder.add_conditional_edges 的联系和区别
  • 基于Django的协同过滤算法养老新闻推荐系统的设计与实现
  • 初识Linux(13) 由基础IO知识简易封装stdio.h中的FILE
  • Unity AI 技术浅析(二)
  • 【时时三省】(C语言基础)赋值语句
  • 大白话 CSS 中transform属性的常见变换类型(平移、旋转、缩放等)及使用场景