当前位置: 首页 > article >正文

PostgreSQL核心揭秘(三)-元组结构

c0b749955bcea90756db873c2dbc767c.jpeg

目录

  1. 概述

2. 堆元组介绍   
    1)HeapTupleHeaderData 结构     
    2)空值位图(Null Bitmap)   
    3)用户数据(User Data)

3. 元组增、删、改操作介绍   

    1)增(INSERT)操作    

    2)删(DELETE)操作    

    3)改(UPDATE)操作

4. 总结

概述
在PostgreSQL中,堆元组(Heap Tuple)是表中一行数据的内部表示。每个堆元组都存储在一个页面(通常为8KB)内,并且由三个主要部分组成:HeapTupleHeaderData 结构、空值位图以及用户数据。

详细介绍

1. HeapTupleHeaderData 结构

HeapTupleHeaderData 是元组头部的数据结构,它包含了关于该元组的一些关键信息。这些信息包括事务相关的数据和一些标志位,用于多版本并发控制(MVCC)。

以下是其主要字段:

类型

长度

描述

t_xmin

交易 ID

4 字节

插入 XID 图章

t_xmax

交易 ID

4 字节

删除 XID 图章

t_cid

CommandId

4 字节

插入和/或删除 CID 图章(与 t_xvac 叠加)

t_xvac

交易 ID

4 字节

XID 用于 VACUUM 操作移动行版本

t_ctid

ItemPointerData (项目指针数据)

6 字节

此行版本或更新行版本的当前 TID

t_infomask2

uint16

2 字节

属性数量,以及各种标志位

t_infomask

uint16

2 字节

各种标志位

t_hoff

uint8

1 字节

用户数据的偏移量

2. 空值位图(Null Bitmap)

空值位图是一个可选的部分,仅当表中有允许NULL值的列时存在。这个位图用来标记哪些列的值是NULL。每个位对应一个列,如果某一位被设置,则表示相应的列是NULL。

3. 用户数据(User Data)

用户数据部分包含实际的字段值。这些值按照表定义中列的顺序排列。对于固定长度的数据类型(如int4),直接存储在用户数据部分;对于可变长度的数据类型(如text、varchar),则会有一个长度前缀,随后是实际的数据。

114cfeed08af7e455c114d524dd15ccf.png

元组增、删、改操作介绍

1. 增(INSERT)操作

f9b8af494da1cede34e0e1ad5a46c8e8.png

假设元组是由 txid=99 的事务插入页面中的,这时被插入元组的首部字段设置如下:

Tuple:

  • t_xmin:设置为 99,因为此元组由 txid=99 的事务所插入。

  • t_xmax:设置为 0,因为此元组尚未被删除或更新。

  • t_cid:设置为 0,因为此元组是由 txid=99 的事务所执行的第一条命令插入的。

  • t_ctid:设置为 (0,1),指向自身,因为这是该元组的最新版本。

2. 删(DELETE)操作

38f1e7c27348b7d210c0419b752952fd.png

假设接下来事务 txid=100 对元组进行了删除操作。此时,删除操作会设置如下:

Tuple(删除后状态):

  • t_xmin:保持为 99,表示该元组的插入事务。

  • t_xmax:设置为 100,因为此元组现在被 txid=100 的事务删除。

  • t_cid:设置为 0,因为删除操作是由 txid=100 事务的第一条命令执行的。

  • t_ctid:保持为 (0,1),仍指向原元组。

死元组最终将从页面中被移除。清除死元组的过程被称为清理(VACUUM)过程

3. 改(UPDATE)操作

0cbf544eb4452cdf61ced1a2e83ee179.png

如果在 txid=101 的事务中,对该元组进行了更新操作。此时,更新操作会创建一个新的元组,且原元组保持不变。新元组的设置如下:

当执行第一条UPDATE命令时,Tuple_1的t_xmax被设为txid 100,在逻辑上被删除,然后Tuple_2被插入,接下来重写Tuple_1的t_ctid以指向Tuple_2。Tuple_1和Tuple_2的头部字段设置如下。

第一条 UPDATE 命令

逻辑删除 Tuple_1:

  • Tuple_1 的 t_xmax 被设置为 100(txid)。

  • Tuple_1 的 t_ctid 从 (0,1) 改写为 (0,2),指向新插入的元组。

    Tuple_1 设置:

  • t_xmax: 100、 t_ctid: (0,2)

插入新元组 Tuple_2:

  • Tuple_2 的 t_xmin 被设置为 100(当前事务 txid)。

  • t_xmax 设置为 0(尚未被删除或更新)。

  • t_cid 设置为 0(表示这是该事务的第一条操作)。

  • t_ctid 设置为 (0,2)(指向自身)。

    Tuple_2 设置:

  • t_xmin: 100、t_xmax: 0、t_cid: 0、t_ctid: (0,2)

第二条 UPDATE 命令

逻辑删除 Tuple_2:

  • Tuple_2 的 t_xmax 被设置为 100(当前事务 txid)。

  • Tuple_2 的 t_ctid 从 (0,2) 改写为 (0,3),指向新插入的元组。

     Tuple_2 设置:

  • t_xmax: 100、t_ctid: (0,3)

插入新元组 Tuple_3:

  • Tuple_3 的 t_xmin 被设置为 100(当前事务 txid)。

  • t_xmax 设置为 0(尚未被删除或更新)。

  • t_cid 设置为 1(表示这是该事务的第二条操作)。

  • t_ctid 设置为 (0,3)(指向自身)。

Tuple_3 设置:

  • t_xmin: 100、t_xmax: 0、t_cid: 1、t_ctid: (0,3)

与删除操作类似,如果txid=100的事务已经提交,那么Tuple_1和Tuple_2就成了死元组,而如果txid=100的事务中止,Tuple_2和Tuple_3就成了死元组。

总结

在这个过程中,元组的状态变化如下:

  • 插入:新元组的字段由插入事务的 txid 决定。

  • 删除:删除操作更新t_xmax,记录删除事务的txid。

  • 更新:更新操作创建新的元组,新的 t_xmin 表示更新事务,并且t_cid和t_ctid 反映新的版本信息。

公众号内直接回复加群,即可添加微信群。觉得帖子写的不错,点点关注,点点赞,多多转载,请多多支持。

往期帖子汇总:

数据库维护工具:数据迁移、性能监控、数据修复的全面工具汇总

上一篇:PostgreSQL核心揭秘(二)-进程和内存架构
PostgreSQL核心揭秘(一):数据库集簇

从零开始学PostgreSQL-工具篇2:碎片回收pg_repack

从零开始学PostgreSQL-工具篇:备份与恢复

从零开始学PostgreSQL (十四):高级功能

从零开始学PostgreSQL (十三):并行查询

从零开始学PostgreSQL (十二):高效批量写入数据库

从零开始学PostgreSQL (十一):并发控制

从零开始学PostgreSQL (十):磁盘使用情况

从零开始学PostgreSQL (九):任务进度报告

从零开始学PostgreSQL (八):监控数据库动态

从零开始学PostgreSQL (七):高可用性、负载平衡和复制

从零开始学PostgreSQL (六):备份和恢复

从零开始学PostgreSQL (五):日常数据库维护任务

从零开始学PostgreSQL (四):数据库角色

从零开始学PostgreSQL (三):索引篇

从零开始学PostgreSQL (二):配置文件

从零开始学PostgreSQL (一):Centos8 RPM安装PostgreSQL16


http://www.kler.cn/a/383655.html

相关文章:

  • 餐饮业的数字化转型:JSP订餐管理系统的设计与开发
  • Canoe E2E校验自定义Checksum算法
  • HTML基础学习(1)
  • 亚远景-SO 21434标准下的汽车网络安全:风险评估与管理的关键实践
  • 记录一个SVR学习
  • 本地摄像头视频流在html中打开
  • 【科普】conda、virtualenv, venv分别是什么?它们之间有什么区别?
  • 讲讲RabbitMQ 性能优化
  • Qt中弹出窗口的实现与鼠标事件处理
  • ctfshow(91,96,97)--PHP特性
  • Spring Boot 中Nacos的用法及流程
  • lua入门教程 :模块和包
  • 【C++】vector 类深度解析:探索动态数组的奥秘
  • Hive面试题-- hive中查询用户连续三天登录记录的实现与解析
  • 【码农日常】Vscode Clangd初始化失败(Win10)
  • M1M2 MAC安装windows11 虚拟机的全过程
  • CSS中常见的两列布局、三列布局、百分比和多行多列布局!
  • 13.React useTimeout
  • 服务器虚拟化:现代IT基础设施的基石
  • 【660】基于SSM+Vue的在线学习系统设计与实现
  • 数据库_SQLite3
  • 防止事件冒泡和防止触发子元素
  • Oracle视频基础1.4.4练习
  • python数据结构基础(6)
  • elementui中的新增弹窗在新增数据成功后再新增 发现数据无法清除解决方法
  • 一元二次函数的最值公式