当前位置：首页 > article >正文

【经典面试题】Kafka为什么这么快？

article 2024/11/13 13:04:56

Kafka是一个成熟的消息队列，一直以性能高著称，它之所以能够实现高吞吐量和低延迟，主要是由于以下几个方面的优化。我试着从发送端、存储端以及消费端分别介绍一下。

消息发送

批量发送：Kafka通过将多个消息打包成一个批次，减少了网络传输和磁盘写入的次数，从而提高了消息的吞吐量和传输效率。
异步发送：生产者可以异步发送消息，不必等待每个消息的确认，这大大提高了消息发送的效率。
消息压缩：支持对消息进行压缩，减少网络传输的数据量。
并行发送：通过将数据分布在不同的分区（Partitions）中，生产者可以并行发送消息，从而提高了吞吐量。

消息存储

零拷贝技术：Kafka使用零拷贝技术来避免了数据的拷贝操作，降低了内存和CPU的使用率，提高了系统的性能。
顺序写入磁盘：Kafka将数据顺序写入磁盘，避免了随机写入带来的性能损耗。
页缓存：Kafka将其数据存储在磁盘上，但在访问数据时，它会先将数据加载到内存中的页缓存中，从而提高了数据访问速度。
稀疏索引：Kafka存储消息是通过分段的日志文件，每个分段都有自己的索引文件。这些索引文件中的条目不是对分段中的每条消息都建立索引，而是每隔一定数量的消息建立一个索引点，这就构成了稀疏索引。稀疏索引减少了索引大小，使得加载到内存中的索引更小，提高了查找特定消息的效率。
分区和副本：Kafka采用分区和副本的机制，可以将数据分散到多个节点上进行处理，从而实现了分布式的高可用性和负载均衡。

消息消费

消费者群组：通过消费者群组可以实现消息的负载均衡和容错处理。
并行消费：不同的消费者可以独立地消费不同的分区，实现消费的并行处理。
批量拉取：Kafka支持批量拉取消息，可以一次性拉取多个消息进行消费。减少网络消耗，提升性能。

生产消息 (Production Messages)	存储消息 (Storage Messages)	消费消息 (Consumption Messages)
批量发送 (Bulk Send)	磁盘顺序写入 (Disk Sequential Write)	消费者群组 (Consumer Group)
异步发送 (Asynchronous Send)	页缓存 (Page Cache)	批量拉取 (Bulk Pull)
消息压缩 (Message Compression)	稀疏索引 (Sparse Index)	并行消费 (Parallel Consumption)
并行发送 (Parallel Send)	零拷贝 (Zero Copy)
	分区和副本 (Partition and Replica)

http://www.kler.cn/a/284980.html

相关文章：

git status 命令卡顿的排查

MySql-8.0.40安装详细教程

【MatLab手记】 --从0到了解超超超详过程！！！

内网部署web项目，外网访问不了？只有局域网能访问！怎样解决？

containerd配置私有仓库registry

Python--案例练习

Qt: QGraphicsView二维图形绘图框架

sql 4,创建表类型

HTML ＜template＞标签的基本技巧

flutter 开发中常用的 Widget

Metasploit漏洞利用系列（十）：MSF渗透测试 - 震网三代（远程快捷方式漏洞）实战

Elasticsearch中别名的作用

.NET WPF 抖动动画

python 天气与股票的关系--第一部分，爬取数据

新审视零阶优化在内存高效大模型微调中的应用

你是如何克服编程学习中的挫折感的？——从Bug中找到成长的契机

Linux awk案例

Dataworks_PySpark开发流程

azure-search-openai-demo-csharp does not deploy correctly to azure clooad

vue项目打包压缩静态资源—使用compression-webpack-plugin

是否应该使用WordPress自动更新的功能

ComfyUI使用Flux模型

黑马JavaWeb开发笔记07——Ajax、Axios请求、前后端分离开发介绍、Yapi详细配置步骤

网络压缩之参数量化（parameter quantization）

Spring Boot发送http请求

C语言补习课