什么是zookeeper
ZooKeeper 是一个由 Apache 开源的分布式协调服务,专门为分布式系统提供高效、可靠的协同管理功能。它通过简单的接口和高效的设计,帮助开发者解决分布式环境中的常见问题,如配置管理、服务注册与发现、分布式锁、集群选举等。
---
### 核心概念与功能
1. 数据模型(Znode)
ZooKeeper 的数据结构类似文件系统的树形目录,每个节点称为 Znode。Znode 可以存储少量数据(默认不超过 1MB),并分为两种类型:
- 持久节点:手动创建和删除,长期存在。
- 临时节点:与客户端会话绑定,会话结束自动删除(常用于服务注册)。
- 顺序节点:节点名自动附加全局唯一递增序号(如 `/lock-0000000001`)。
2. Watcher 监听机制
客户端可以监听 Znode 的变化(如数据更新、子节点增减),当事件触发时,ZooKeeper 会实时通知客户端,实现分布式系统的动态感知。
3. 一致性保证
ZooKeeper 基于 ZAB 协议(ZooKeeper Atomic Broadcast),确保集群中所有节点的数据强一致性:
- 所有写操作由 Leader 节点协调,通过多数节点(Quorum)确认后生效。
- 读操作可直接从任意节点获取数据,保证高吞吐。
4. 高可用性
ZooKeeper 集群通常由多个节点(建议奇数个,如 3、5 个)组成,只要半数以上节点存活,服务即可正常运行。
---
### 典型应用场景
1. 配置管理
将系统的配置信息(如数据库地址)存储在 Znode 中,所有服务监听该节点,配置变更时自动同步。
2. 分布式锁
通过创建临时顺序节点实现排他锁或共享锁,协调多进程对共享资源的访问。
3. 服务注册与发现
服务启动时注册为临时节点,宕机时自动移除。客户端通过监听节点列表动态发现可用服务。
4. 领导者选举(Leader Election)
在集群中通过竞争创建临时节点,成功创建的节点成为 Leader,其他节点作为 Follower 并监听 Leader 状态。
---
### 优势与特点
- 简单易用:提供类似文件系统的 API(如 `create`, `delete`, `exists`)。
- 高可靠性:数据持久化到磁盘,通过集群保证高可用。
- 顺序一致性:所有操作按全局顺序执行。
- 轻量高效:适用于高频率读、低频率写的场景。
---
### 常见使用案例
- Apache Kafka:依赖 ZooKeeper 管理 Broker 元数据、Topic 配置和消费者组。
- Hadoop/HBase:用于集群协调、主节点选举。
- Dubbo:作为注册中心管理服务提供者与消费者。
---
### 总结
ZooKeeper 是分布式系统的“基石”,通过统一的协调服务简化了复杂分布式逻辑的实现。尽管后来出现了 Etcd、Consul 等替代方案,ZooKeeper 仍因其成熟稳定被广泛应用于大型系统中。