当前位置: 首页 > article >正文

【kafka系列】Topic 与 Partition

Kafka 的 Topic(主题)Partition(分区) 是数据组织的核心概念,它们的映射关系及在 Broker 上的分布直接影响 Kafka 的性能、扩展性和容错能力。以下是详细解析:


一、Topic 与 Partition 的映射关系

  1. Topic 是逻辑分类,Partition 是物理分片
    • Topic:消息的逻辑分类(例如 order_eventsuser_logs),类似于数据库中的表。
    • Partition:每个 Topic 被划分为多个 Partition,每个 Partition 是一个有序的、不可变的消息队列
      • 消息在 Partition 内按顺序追加(有序),但全局无序(不同 Partition 的消息顺序不保证)。
      • Partition 数量在 Topic 创建时指定,后续可增加(但不能减少)。
  1. 分区的核心作用
    • 并行处理:多个 Consumer 可同时消费不同 Partition,提升吞吐量。
    • 水平扩展:通过增加 Partition 数量,可突破单机性能瓶颈。
    • 容错性:每个 Partition 的副本分布在多个 Broker 上,避免单点故障。
  1. 消息写入规则
    • 生产者通过 Partitioner 决定消息写入哪个 Partition,默认策略:
      • 轮询(Round Robin):无 Key 时均匀分配。
      • 哈希 Key(Hash-based):有 Key 时按 Key 的哈希值选择 Partition,保证相同 Key 的消息进入同一 Partition。


二、Partition 在 Broker 上的分布

1. Partition 副本机制
  • 每个 Partition 有多个副本(Replica),分为两类:
    • Leader 副本:处理所有读写请求,是唯一对外服务的副本。
    • Follower 副本:异步从 Leader 同步数据,不处理客户端请求。
  • 副本数(Replication Factor):创建 Topic 时指定(例如 replication-factor=3 表示每个 Partition 有 3 个副本)。
2. Partition 分布策略

Kafka 会尽量将 Partition 的副本均匀分布在不同的 Broker 上,规则如下:

  1. 第一副本分配
    首个副本的分配策略有两种(由 Broker 参数 broker.rack 决定):
    • 无机架感知:轮询或随机选择一个 Broker。
    • 有机架感知:优先选择不同机架的 Broker。
  1. 后续副本分配
    其他副本按顺序分配到与前一副本不同的 Broker(尽量分散)。

示例
假设一个 Kafka 集群有 3 个 Broker(Broker 0、1、2),创建一个 Topic test,参数为 partitions=3replication-factor=2
可能的分布如下:

Partition 0: Leader=Broker0, Replicas=[Broker0, Broker1]
Partition 1: Leader=Broker1, Replicas=[Broker1, Broker2]
Partition 2: Leader=Broker2, Replicas=[Broker2, Broker0]
3. 查看 Partition 分布

使用 Kafka CLI 工具查看 Topic 的 Partition 分布:

bash bin/kafka-topics.sh --describe --topic test --bootstrap-server localhost:9092

# 输出示例:
Topic: test	PartitionCount: 3	ReplicationFactor: 2
	Topic: test	Partition: 0	Leader: 0	Replicas: 0,1	Isr: 0,1
	Topic: test	Partition: 1	Leader: 1	Replicas: 1,2	Isr: 1,2
	Topic: test	Partition: 2	Leader: 2	Replicas: 2,0	Isr: 2,0
  • Replicas:该 Partition 的所有副本所在的 Broker ID。
  • Leader:当前处理请求的副本所在的 Broker ID。
  • Isr(In-Sync Replicas):与 Leader 保持同步的副本集合。

三、设计 Partition 分布的关键原则

  1. 均匀分布
    • Partition 的 Leader 应均匀分布在所有 Broker 上,避免单个 Broker 成为性能

http://www.kler.cn/a/539713.html

相关文章:

  • DeepSeek训练成本与技术揭秘
  • 【0401】Postgres内核 CREATE DATABASE database-name 源码实现 ①
  • R语言LCMM多维度潜在类别模型流行病学研究:LCA、MM方法分析纵向数据
  • 移植BOA服务器到GEC2440开发板
  • 基于SpringBoot的线上历史馆藏管理系统
  • DeepSeek-r1和O1、O3mini谁更强?
  • x小兔鲜vue.js
  • C#中的Frm_Welcome.Instance.Show(),是什么意思
  • c++ 输入输出笔记
  • 流氓软件一键屏蔽免疫工具Baidun Armor v3.2.1 绿色版
  • Centos Ollama + Deepseek-r1+Chatbox运行环境搭建
  • DeepSeek从入门到精通教程PDF清华大学出版
  • 【CubeMX+STM32】SD卡 文件系统读写 FatFs+SDIO+DMA
  • Java语言的区块链
  • kafka服务端之副本
  • Ubuntu 下 nginx-1.24.0 源码分析 - ngx_ssl_version 函数
  • 51单片机俄罗斯方块开机动画
  • 物理信息机器学习(PIML)的基础探讨及技术实现
  • 上传文件防木马函数
  • 【如何掌握CSP-J 信奥赛中的广搜算法】
  • 【每日一题 | 2025】2.3 ~ 2.9
  • Git 功能分支工作流程是如何支持社交化编程
  • 通过案例讲述docker,k8s,docker compose三者的关系
  • springboot005学生心理咨询评估系统
  • nodejs - vue 视频切片上传,本地正常,线上环境导致磁盘爆满bug
  • 汽车售后诊断软件手机端架构设计