当前位置：首页 > article >正文

Redis分片集群

article 2025/3/16 13:10:17

1. Redis Cluster的核心概念

哈希槽（Hash Slots）

Redis Cluster使用哈希槽来实现数据分片。整个数据空间被划分为16384个哈希槽（slot），这些槽均匀分布到不同的主节点上。

哈希计算：对于每一个键，Redis使用CRC16算法计算其哈希值，并对16384取模，确定该键属于哪个哈希槽。
槽分配：每个主节点负责一部分哈希槽。例如，如果有三个主节点，它们可以分别负责5461个哈希槽。

主从复制与故障转移

为了保证高可用性，每个主节点都有一个或多个从节点。当主节点发生故障时，集群会自动进行故障转移，提升其中一个从节点为新的主节点。

主从同步：从节点会持续地从主节点同步数据，以保持数据的一致性。同步过程包括全量同步和增量同步。
故障检测与恢复：集群中的节点会定期交换信息，监测其他节点的状态。如果某个主节点失效，集群会选择一个从节点升级为主节点，并重新分配哈希槽。

2. 详细的配置步骤

准备节点

假设我们有6个Redis实例（3个主节点和3个从节点），分别运行在不同的端口上。

节点配置示例 (`redis-node.conf`)

每个节点的配置文件略有不同，主要是端口号和角色的不同。以下是每个节点的配置文件示例：

主节点1: `redis-node1.conf` (Port: 7000)

# 端口号
port 7000

# 启用集群模式
cluster-enabled yes

# 集群配置文件路径，用于存储集群状态信息
cluster-config-file nodes-7000.conf

# 节点超时时间（毫秒），超过此时间未响应视为故障
cluster-node-timeout 5000

# 开启AOF持久化
appendonly yes

# 可选配置项
# 设置密码保护
# requirepass yourpassword

# 设置最大内存使用量
# maxmemory 2gb

# 设置持久化策略
# appendfsync everysec

从节点1: `redis-node2.conf` (Port: 7001)

# 端口号
port 7001

# 启用集群模式
cluster-enabled yes

# 集群配置文件路径，用于存储集群状态信息
cluster-config-file nodes-7001.conf

# 节点超时时间（毫秒），超过此时间未响应视为故障
cluster-node-timeout 5000

# 开启AOF持久化
appendonly yes

# 设置从节点的主节点
slaveof 127.0.0.1 7000

# 可选配置项
# 设置密码保护
# requirepass yourpassword

# 设置最大内存使用量
# maxmemory 2gb

# 设置持久化策略
# appendfsync everysec

主节点2: `redis-node3.conf` (Port: 7002)

port 7002
cluster-enabled yes
cluster-config-file nodes-7002.conf
cluster-node-timeout 5000
appendonly yes

从节点2: `redis-node4.conf` (Port: 7003)

port 7003
cluster-enabled yes
cluster-config-file nodes-7003.conf
cluster-node-timeout 5000
appendonly yes
slaveof 127.0.0.1 7002

主节点3: `redis-node5.conf` (Port: 7004)

port 7004
cluster-enabled yes
cluster-config-file nodes-7004.conf
cluster-node-timeout 5000
appendonly yes

从节点3: `redis-node6.conf` (Port: 7005)

port 7005
cluster-enabled yes
cluster-config-file nodes-7005.conf
cluster-node-timeout 5000
appendonly yes
slaveof 127.0.0.1 7004

启动节点

依次启动所有节点：

redis-server /path/to/redis-node1.conf
redis-server /path/to/redis-node2.conf
redis-server /path/to/redis-node3.conf
redis-server /path/to/redis-node4.conf
redis-server /path/to/redis-node5.conf
redis-server /path/to/redis-node6.conf

创建集群

使用redis-cli工具创建集群：

redis-cli --cluster create 127.0.0.1:7000 127.0.0.1:7001 127.0.0.1:7002 127.0.0.1:7003 127.0.0.1:7004 127.0.0.1:7005 --cluster-replicas 1

这里的--cluster-replicas 1表示每个主节点有一个从节点。

3. 实际操作示例

写入数据

你可以像平常一样写入数据，Redis Cluster会自动将数据分配到合适的节点上。

redis-cli -c -p 7000
127.0.0.1:7000> SET key1 value1
-> Redirected to slot [12182] located at 127.0.0.1:7002
OK

注意这里-c参数表示启用集群模式，这样客户端会自动处理重定向命令。

读取数据

读取数据时，同样可以通过任意节点访问：

redis-cli -c -p 7000
127.0.0.1:7000> GET key1
-> Redirected to slot [12182] located at 127.0.0.1:7002
"value1"

故障模拟与恢复

你可以手动关闭一个主节点来模拟故障，并观察集群如何进行自动故障转移。

关闭主节点

redis-cli -p 7002 shutdown

检查集群状态

redis-cli -p 7000 cluster nodes

你应该看到原来的从节点已经被提升为主节点，并接管了原主节点的哈希槽。

4. Redis Cluster的内部机制

数据分片与重定向

数据分片：每个键通过哈希槽映射到特定的主节点。客户端发送的请求会被路由到相应的节点。
重定向：如果客户端请求了一个不属于当前节点的哈希槽，集群会返回一个MOVED响应，指示客户端应该连接到正确的节点，客户端收到这个响应后，会自动重定向到指定的节点。

# 连接到集群中的任意节点
redis-cli -c -p 7000

# 尝试设置一个键
127.0.0.1:7000> SET key1 value1
-> Redirected to slot [12182] located at 127.0.0.1:7002
OK

# 从同一个客户端再次尝试获取相同的键
127.0.0.1:7000> GET key1
-> Redirected to slot [12182] located at 127.0.0.1:7002
"value1"

主从复制与故障转移

主从同步：从节点会持续地从主节点同步数据，以保持数据的一致性。同步过程包括全量同步和增量同步。
- 全量同步：首次同步时，从节点会从主节点获取完整的数据集。
  - 过程：从节点向主节点发起全量同步请求，主节点生成RDB文件并传输给从节点。从节点加载RDB文件并开始接收后续的增量更新。
- 增量同步：后续同步时，从节点会接收主节点的增量更新（如写操作日志）。
  - 过程：主节点记录写操作日志（称为复制积压缓冲区），从节点根据偏移量请求缺失的部分日志。
故障检测：集群中的节点会定期交换信息，监测其他节点的状态。如果某个主节点连续多次未能响应心跳消息，它会被标记为疑似下线（PFAIL）。
- 心跳检查：每个节点会定期向其他节点发送心跳消息，默认间隔是1秒。
- 标记PFAIL：如果一个节点在一定时间内没有回应心跳消息，它会被标记为疑似下线（PFAIL）。
- 标记FAIL：如果大多数节点都标记某个节点为PFAIL，则该节点会被标记为FAIL。
故障转移：一旦主节点被确认下线，集群会选择一个从节点提升为主节点，并重新分配哈希槽。具体步骤如下：
1. 选举：集群中的节点会选举一个新的主节点。选举过程基于Raft一致性算法，确保只有一个从节点被选中。
  - 投票过程：每个从节点会根据一定的规则投票给一个候选者。最终得票最多的从节点会被选为新的主节点。
2. 数据同步：新当选的主节点会从其他节点获取最新的数据，确保数据一致性。
  - 部分同步：如果从节点已经有部分数据，可以只同步缺失的部分数据。
  - 全量同步：如果从节点的数据完全丢失，需要进行全量同步。
3. 重新分配哈希槽：新的主节点接管原主节点的哈希槽，集群恢复正常服务。