【ETCD】ETCD 架构揭秘:内部各组件概览
ETCD 的主要组件及它们之间的关联关系如下:
目录
- 1. Client(客户端)
- 2. gRPC 接口
- 3. Etcd Server Main Loop(ETCD 主循环)
- 4. Raft(共识模块)
- 5. Peer Etcd Nodes(ETCD 集群节点)
- 6. MVCC(多版本并发控制)
- 7. Write Ahead Log(WAL)
- 8. BoltDB(持久化存储)
- 总结:组件之间的关联关系
1. Client(客户端)
- 作用:客户端通过 gRPC 协议与 ETCD 服务器进行通信,发送请求(例如键值存储、查询、删除等操作)。
- 关联:客户端通过 gRPC 接口将请求发送到 ETCD 服务器。
2. gRPC 接口
- 作用:gRPC 是 ETCD 对外提供服务的通信接口,负责接收客户端请求并将请求交给 ETCD 服务的主循环进行处理。
- 关联:gRPC 接口是客户端与 ETCD 服务主循环的桥梁,提供了高效的 RPC 通信机制。
3. Etcd Server Main Loop(ETCD 主循环)
- 作用:ETCD 的主循环负责处理客户端请求,包括键值存储、事务操作等。它会将请求进一步传递给 Raft 模块或 MVCC 存储层。
- 关联:
- 将写请求交给 Raft 模块 处理。
- 通过 MVCC 管理键值数据的版本。
- 数据持久化到 WAL 和 BoltDB。
4. Raft(共识模块)
- 作用:Raft 是 ETCD 实现分布式一致性的核心模块,它确保所有节点(Leader 和 Follower)之间的数据一致。
- 处理写操作:Leader 节点接收请求并将其同步给其他 Peer 节点。
- 数据复制:将操作日志同步到集群中的其他节点。
- 管理节点状态:选举 Leader、故障恢复等。
- 关联:
- 通过 Raft HTTP(P2P) 与其他 Peer Etcd Nodes 进行日志同步。
- 操作日志被存储到 Write Ahead Log(WAL)。
- 成功的操作通过 MVCC 应用到存储中。
5. Peer Etcd Nodes(ETCD 集群节点)
- 作用:集群中的其他 ETCD 节点(Peer Nodes)与 Leader 节点进行同步,确保数据副本的一致性。
- 关联:
- 通过 Raft HTTP(P2P) 与 Leader 节点通信,接收日志复制。
- 确保每个节点的数据和状态保持一致。
- 从 Raft 接收到的操作会存储到本地的 WAL 和 BoltDB。
6. MVCC(多版本并发控制)
- 作用:MVCC 是 ETCD 的数据存储机制,管理键值对及其多个版本。每次修改键值对时,都会生成一个新的版本。
- 关联:
- 数据修改请求通过 Raft 模块 确认后,会被提交给 MVCC。
- MVCC 数据最终会持久化存储到 BoltDB。
- MVCC 通过 版本号(revision) 记录数据的历史。
7. Write Ahead Log(WAL)
- 作用:WAL 记录所有写操作的日志,保证数据在崩溃时的持久化和恢复。
- 在操作提交到存储(BoltDB)之前,先写入 WAL。
- 日志可以用于崩溃恢复。
- 关联:
- Raft 模块的操作日志首先写入 WAL,保证数据不会丢失。
- WAL 日志之后被应用到 MVCC 和 BoltDB,实现数据的最终存储。
8. BoltDB(持久化存储)
- 作用:BoltDB 是 ETCD 的底层存储引擎,它将 MVCC 数据持久化存储到磁盘,提供高效的键值查询和事务支持。
- 关联:
- WAL 中的操作日志最终会被写入 BoltDB。
- MVCC 的数据版本和键值存储都依赖于 BoltDB 进行持久化。
总结:组件之间的关联关系
- 客户端 通过 gRPC 接口 与 ETCD 服务通信。
- ETCD 主循环 处理客户端请求,涉及 Raft 和 MVCC。
- Raft 模块:
- 负责数据的一致性,将操作日志复制到其他 Peer Etcd Nodes。
- 日志操作会先存储到 WAL。
- WAL 记录操作日志,提供数据恢复支持。
- MVCC 处理数据的多版本存储,并最终将数据写入 BoltDB。
- BoltDB 持久化 MVCC 数据,提供数据存储和查询功能。
- Peer Etcd Nodes 通过 Raft 协议与 Leader 节点同步数据,保持集群一致性。