当前位置：首页 > article >正文

Apache Iceberg Architecture—Iceberg 架构详解

article 2025/3/11 15:45:00

Apache Iceberg Architecture

在这里插入图片描述

Apache Iceberg 的架构可以分为三个主要层次：Iceberg Catalog、元数据层和数据层。

在这里插入图片描述

Iceberg Catalog 是 Iceberg 的顶层组件，负责管理所有 Iceberg 表的元数据和元数据操作。

Catalog 管理表的架构和元数据，提供了创建、查询和修改表的接口，是用户和系统与Iceberg表交互的入口点。
在这里插入图片描述

Iceberg Catalog （catalog 目录）提供了一个中心位置，用户可以通过它找到每个表当前元数据文件的位置，是读取和写入 Iceberg 表的关键组件。

在这里插入图片描述

当前元数据指针：
- Iceberg Catalog 中保存每个表的当前元数据文件的指针（current metadata pointer），确保用户能够获取到最新的元数据。
原子操作支持：
- Catalog 必须支持原子操作，以确保在更新当前元数据指针时能够提供事务的原子性和正确性。
- 常见的支持方式包括 HDFS、Hive Metastore 和 Nessie。
元数据存储方式：
- 不同的 Catalog 方案存储当前元数据指针的方式不同：
  - HDFS：在表的元数据文件夹中有一个名为 version-hint.txt 的文件，内容为当前元数据文件的版本号。
  - Hive Metastore：表在元存储中的条目包含一个属性，存储当前元数据文件的位置。
  - Nessie：Nessie 存储每个表的当前元数据文件的位置。
查询流程：
- 当执行 SELECT 查询时，查询引擎首先访问 Iceberg Catalog，获取目标表的当前元数据文件位置，然后打开该文件进行数据读取。

Iceberg 的元数据层负责管理和存储有关表的关键信息，确保高效的数据读取与操作。元数据主要包括三个部分：元数据文件、清单列表和清单文件。

在这里插入图片描述

在这里插入图片描述
元数据文件保存关于表的基本信息：

表的 schema：定义表中字段的类型和名称。
分区信息：说明数据如何在表中分区以优化查询性能。
快照（Snapshots）：记录表在不同时间点的状态。每个快照里面会列出表在某个时刻的所有 data files 列表。data files是存储在不同的manifest files里面，manifest files是存储在一个Manifest list文件里面，而一个Manifest list文件代表一个快照。

在这里插入图片描述

在这里插入图片描述

当执行 SELECT 查询时，查询引擎首先通过目录获取当前元数据文件的位置，然后读取当前快照的 ID，并在快照数组中查找该 ID，最终打开与之对应的清单列表。

在这里插入图片描述
清单列表是一个指向多个清单文件的列表。每个清单文件记录一个快照的详细信息：

在这里插入图片描述

查询引擎打开清单列表后，读取清单路径并加载清单文件。此时，可以进行一些优化，例如基于行数或分区信息过滤数据。

在这里插入图片描述
清单文件是 Iceberg 管理数据文件的核心，主要职责包括：

在这里插入图片描述

在这里插入图片描述

当查询引擎打开清单文件后，读取文件路径和相关统计信息，以便访问实际的数据文件，并利用统计信息进行优化。

数据层是实际存储数据的地方，Data Files数据文件是Apache Iceberg表真实存储数据的文件。

数据文件 (Data Files)：
- Iceberg 支持多种数据文件格式，如 Parquet、ORC 和 Avro。这些文件按照列式存储，便于高效的读写和压缩。如果文件格式选择的是parquet,那么文件是以“.parquet”结尾。
- 数据文件按照 Iceberg 的分区策略进行组织，以优化数据访问。
- Iceberg每次更新会产生多个数据文件（data files）。

在这里插入图片描述