当前位置: 首页 > article >正文

Kafka高可用机制总结

1. 集群模式

1.1组成结构

Kafka集群由多个broker实例构成,每个broker是一个Kafka实例。

1.2高可用保障

某一台broker宕机时,其他broker仍可对外提供服务,保证了集群的高可用性。但仅回答此点过于简单,需结合分区复制机制回答以更好应对面试官。

在这里插入图片描述

2. 分区复制机制初步

2.1分区与副本

  • 一个topic分为多个分区,每个分区有多个副本,且分布在不同broker。如一个topic有三个分区p0、p1、p2,每个分区有三个副本,存储在不同broker。
  • 副本间为主从关系,同一分区的所有副本内容相同。

在这里插入图片描述

2.2数据同步方式

  • 生产者按策略将消息存储到不同分区,Kafka内部为分区提供副本机制以保证高可用性。
  • 分区副本分为ISR副本(同步请求方式,数据更完整)和普通副本(异步请求方式,效率高但不能保证数据完整性)。
  • ISR 的全称是 “in sync replica”,即 “需要同步复制保存的副本”。在 Kafka 中,ISR 副本在同步数据时采用同步请求方式,能更好地保证数据完整性。

2.3选主原则

Kafka分区副本的选主原则是

  • 先从ISR列表中选择leader副本
  • 当ISR列表中的副本均宕机时,才从普通副本中选择一个作为leader。
  1. 优先从ISR列表选主:ISR副本采用同步请求方式同步数据,数据完整性更好,所以在正常情况下,会优先从ISR列表中挑选leader副本。
  2. ISR列表副本均宕机时的处理:如果ISR列表中的所有副本都不可用,此时为了保证系统的基本运行,会从普通副本中选择一个作为leader。普通副本采用异步请求方式同步数据,虽然效率较高,但数据完整性不能完全保证。

这种选主原则的设计旨在平衡数据完整性和系统可用性之间的关系,

确保在不同情况下Kafka系统都能尽量稳定运行。

3. ISR配置

3.1可配置性

在broker配置文件中可设定topic副本数量和ISR最少个数,需根据实际情况设置。

3.2设置考量

不能将所有副本设为ISR,因为ISR同步保存数据性能不高,普通副本异步保存数据效率更高。一般至少设置一个ISR列表,其他设为普通副本,以平衡高可用性和数据存储时效性。

4. 面试回答建议

4.1回答框架

从集群和复制机制两个层面回答。集群层面提及由多个broker组成,宕机不影响对外服务;复制机制层面详细阐述分区、副本、副本存储、主从关系、数据同步方式、选主原则等。

4.2应对追问

若面试官追问ISR,需解释ISR是需要同步复制保存的副本,分区副本分为ISR副本(同步请求)和普通副本(异步请求),以及选主原则与ISR的关系等。


http://www.kler.cn/a/456316.html

相关文章:

  • WebSocket 入门详解
  • bishengjdk-8
  • 上手教程:使用Terraform打造弹性VPC架构
  • UniApp 页面布局基础
  • 大数据技术-Hadoop(一)Hadoop集群的安装与配置
  • 缓存管理自动化:JuiceFS 企业版 Cache Group Operator 新特性发布
  • Linux-frp_0.61.1内网穿透的配置和使用
  • 数据结构与算法(JAVA语言版解密)
  • CDN(Content Delivery Network,内容分发网络)
  • 浏览器语音视频功能
  • 【每日学点鸿蒙知识】webview性能优化、taskpool、热更新、Navigation问题、调试时每次都卸载重装问题
  • Flume和Kafka的区别?
  • PlasmidFinder:质粒复制子的鉴定和分型
  • 进军AI大模型-环境配置
  • Redis 数据类型全解析:基础与进阶应用场景
  • 【PHP】部署和发布PHP网站到IIS服务器
  • 如何安全删除 GitHub 提交记录及其操作步骤
  • 2848、与车相交的点
  • Kafka 数据传输的事务类型
  • SLES网络
  • 【机器学习(九)】分类和回归任务-多层感知机(Multilayer Perceptron,MLP)算法-Sentosa_DSML社区版 (1)111
  • 机器学习随机森林回归时间序列预模型中时间滑动窗口作用以及参数设置
  • 基于openEuler22.09部署OpenStack Yoga云平台(一)
  • 《机器视觉:开启智能新时代》
  • MySQL学习之表查询操作
  • Express.js 有哪些常用的中间件?