当前位置: 首页 > article >正文

Kafka3.8.0+Centos7.9的安装参考

Kafka3.8.0+Centos7.9的安装参考

  1. 环境准备

操作系统版本:centos7.9

用户/密码:root/1qazXSW@

主机名

IP地址

安装软件

下载地址

k1

192.168.207.131

  1. jdk1.8
  2. zookeeper3.9.2
  3. kafka_2.13-3.8.0
  4. efak-web-3.0.1

1)

Java Downloads | Oracle

2)

Apache ZooKeeper

3)

Apache Kafka

4)

EFAK

k2

192.168.207.132

  1. jdk1.8
  2. zookeeper3.9.2
  3. kafka_2.13-3.8.0

k3

192.168.207.133

  1. jdk1.8
  2. zookeeper3.9.2
  3. kafka_2.13-3.8.0

以下三台机器都操作:

1.1修改/etc/hosts

127.0.0.1   localhost localhost.localdomain localhost4 localhost4.localdomain4

::1         localhost localhost.localdomain localhost6 localhost6.localdomain6

192.168.207.131 k1

192.168.207.132 k2

192.168.207.133 k3

1.2关闭防火墙:

systemctl stop firewalld

systemctl disable firewalld

1.3禁用selinux

setenforce 0# 查看临时禁用是否生效

getenforcePermissive 

永久修改 /etc/selinux/config 并将 SELINUX=disabled

1.4文件描述符调整

#编辑配置文件 /etc/security/limits.conf  (永久生效)

* - nofile 100000

#命令行执行(当前会话生效)

ulimit -n 100000

1.5进程可以使用的最大内存映射区域数

Kafka 之所以吞吐量高,其中的一个重要原因就是因为 Kafka 在 Consumer 读取日志文件时使用了 mmap 的方式。mmap 将磁盘文件映射到内存,支持读和写,对内存的操作会反映在磁盘文件上。当客户端读取 Kafka 日志文件时,在进行 log 文件读取的时候直接将 log 文件读入用户态进行缓存,绕过了内核态的 Page Cache,避免了内核态和用户态的切换。

我们可以通过以下方式修改进程可以使用的最大内存映射区域数。

#编辑配置文件 /etc/sysctl.conf  (永久生效)

vm.max_map_count=262144

编辑完文件后命令行执行 sysctl -p  立即永久生效

#命令行执行

sysctl -w vm.max_map_count=262144 (当前会话生效)

2.安装步骤

2.1安装jdk1.8

下载地址:

Java Downloads | Oracle

[root@k1 kafka-web]# java -version

openjdk version "1.8.0_412"

OpenJDK Runtime Environment (build 1.8.0_412-b08)

OpenJDK 64-Bit Server VM (build 25.412-b08, mixed mode)

[root@k1 kafka-web]# echo $JAVA_HOME

/usr/lib/jvm/java-1.8.0-openjdk-1.8.0.412.b08-1.el7_9.x86_64

[root@k1 kafka-web]#

/etc/profile文件末尾添加如下环境变量,并执行source /etc/profile生效:

export JAVA_HOME=/usr/lib/jvm/java-1.8.0-openjdk-1.8.0.412.b08-1.el7_9.x86_64

export PATH=$PATH:$JAVA_HOME/bin

export KE_HOME=/opt/kafka-web/efak-web-3.0.1

export PATH=$PATH:$KE_HOME/bin

2.2安装zookeeper

Zookeeper特点:

1)Zookeeper:一个领导者(Leader),多个跟随者(Follower)组成的集群。

2) Zookeepe集群中只要有半数以上节点存活,Zookeeper集群就能正常服务。所以Zookeeper适合安装奇数台服务器。

3)全局数据一致:每个Server保存一份相同的数据副本,Client无论连接到哪个Server,数据都是一致的。

4)更新请求顺序执行,来自同一个Client的更新请求按其发送顺序依次执行,即先进先出。

5)数据更新原子性,一次数据更新要么成功,要么失败。

6)实时性,在一定时间范围内,Client能读到最新数据。

2.2.1下载并解压到指定路径:

下载介质:

Apache ZooKeeper

提前创建如下目录:

mkdir –p /opt/zookeeper

mkdir –p /opt/zookeeper/zkdata

mkdir –p /opt/zookeeper/zkdatalog

cd /opt/zookeeper

tar -zxvf zookeeper-xxx.tar.gz

2.2.2修改配置文件zoo.cfg:

 [root@k1 conf]# pwd

/opt/zookeeper/zookeeper-3.9.2/conf

mv zoo_sample.cfg zoo.cfg并修改如下:红色的内容

[root@k1 conf]# cat zoo.cfg |grep -v "^$"|grep -v "#"

tickTime=2000

initLimit=10

syncLimit=5

dataDir=/opt/zookeeper/zkdata

dataLogDir=/opt/zookeeper/zkdatalog

clientPort=12181

server.1=192.168.207.131:12888:13888

server.2=192.168.207.132:12888:13888

server.3=192.168.207.133:12888:13888

autopurge.purgeInterval=1

autopurge.snapRetainCount=3

#server.1 这个1是服务器的标识也可以是其他的数字, 表示这个是第几号服务器,用来标识服务器,这个标识要写到快照目录下面myid文件里
#192.168.207.131为集群里的IP地址,第一个端口是masterslave之间的通信端口,默认是2888,当前修改为12888,第二个端口是leader选举的端口,集群刚启动的时候选举或者leader挂掉之后进行新的选举的端口默认是3888,当前修改为13888

2.2.3创建myid文件

三个节点分别创建1,2,3,必须不同数值。

#k1

echo "1" > /opt/zookeeper/zkdata/myid

#k2

echo "2" > /opt/zookeeper/zkdata/myid

#k3

echo "3" > /opt/zookeeper/zkdata/myid

2.2.4启动服务

3台都操作:

#进入到Zookeeper的bin目录下

[root@k1 conf]# cd /opt/zookeeper/zookeeper-3.9.2/bin

#启动服务

[root@k1 bin]#./zkServer.sh start

#停服务

[root@k1 bin]#./zkServer.sh stop

#查看状态

[root@k1 bin]# ./zkServer.sh status

ZooKeeper JMX enabled by default

Using config: /opt/zookeeper/zookeeper-3.9.2/bin/../conf/zoo.cfg

Client port found: 12181. Client address: localhost. Client SSL: false.

Mode: follower #它是否为领导

zk集群一般只有一个leader,多个follower,主一般是相应客户端的读写请求,而从主同步数据,当主挂掉之后就会从follower里投票选举一个leader出来。

[root@k1 bin]# jps

9719 QuorumPeerMain

25384 Jps

2.3安装kafka

Kafka是一个高性能、分布式的消息队列系统,用于实时数据传输和处理。在实际应用中,为了保证高可用性和容错性,通常会部署一个由多个节点组成的Kafka集群。其中,Kafka集群至少需要3个节点,这是为了保证集群的稳定性和可靠性。

## 为什么需要三个节点:

  1. **容错性**:当一个节点发生故障时,集群仍然能够正常运行。如果只有两个节点,当其中一个节点宕机时,另一个节点无法构成多数派,整个集群无法正常工作。因此,至少需要三个节点,即使有一个节点宕机,仍然可以保证集群的正常运行。
  2. **选举机制**:Kafka使用Zookeeper来进行节点的选举,保证集群的一致性。在一个多节点的Kafka集群中,当有节点宕机时,剩余节点可以通过选举机制选择新的Leader节点来维持集群的正常运行。
  3. **数据复制**:Kafka采用副本机制来保证数据的可靠性和高可用性。通过在不同节点上保存数据的副本,即使有节点宕机,数据仍然可以被访问。当只有两个节点时,无法进行数据副本的分布,容易造成数据丢失。

2.3.1下载并解压到指定路径:

Apache Kafka

#创建目录
cd /opt/
mkdir kafka #创建项目目录
cd kafka
mkdir -p /opt/kafka/kafkalogs #创建kafka消息目录,主要存放kafka消息

#解压软件
tar -xaf kafka_2.13-3.8.0.tgz

2.3.2修改配置文件server.properties:

进入到config目录

cd /opt/kafka/kafka_2.13-3.8.0/config/
主要关注:server.properties 这个文件即可

[root@k1 config]# pwd

/opt/kafka/kafka_2.13-3.8.0/config

主要修改红色的部分内容:

[root@k1 config]# cat server.properties |grep -v "^$"|grep -v "#"

broker.id=1 ##另外两台是23,不能重复

num.network.threads=3

num.io.threads=8

socket.send.buffer.bytes=102400

socket.receive.buffer.bytes=102400

socket.request.max.bytes=104857600

log.dirs=/opt/kafka/kafkalogs

num.partitions=1

num.recovery.threads.per.data.dir=1

offsets.topic.replication.factor=1

transaction.state.log.replication.factor=1

transaction.state.log.min.isr=1

log.retention.hours=168

log.retention.check.interval.ms=300000

zookeeper.connect=192.168.207.131:12181,192.168.207.132:12181,192.168.207.133:12181

zookeeper.connection.timeout.ms=18000

group.initial.rebalance.delay.ms=0

说明:

broker.id=0  #当前机器在集群中的唯一标识,和zookeeper的myid性质一样
port=9092 #当前kafka对外提供服务的端口默认是9092

log.dirs=/opt/kafka/kafkalogs/ #消息存放的目录,这个目录可以配置为“,”逗号分割的表达式,上面的num.io.threads要大于这个目录的个数这个目录,如果配置多个目录,新创建的topic他把消息持久化的地方是,当前以逗号分割的目录中,那个分区数最少就放那一个

参考文档:Kafka【第一篇】Kafka集群搭建-CSDN博客

2.3.3启动Kafka集群并测试

1)启动服务(3台都需要操作和启动)

cd
/opt/kafka/kafka_2.13-3.8.0/bin #进入到kafka的bin目录

##修改kafka-server-start.sh防止提示内存不足以及JMX连接的问题:

if [ "x$KAFKA_HEAP_OPTS" = "x" ]; then

    export KAFKA_HEAP_OPTS="-server -Xms2G -Xmx2G -XX:PermSize=128m -XX:+UseG1GC -XX:MaxGCPauseMillis=200 -XX:ParallelGCThreads=8 -XX:ConcGCThreads=5 -XX:InitiatingHeapOccupancyPercent=70"

    export JMX_PORT="9999"

fi

#从后台启动Kafka集群
./kafka-server-start.sh -daemon ../config/server.properties

停服务:./kafka-server-stop.sh -daemon ../config/server.properties

2)检查服务是否启动

#执行命令jps
20348 Jps
4233 QuorumPeerMain
18991 Kafka
3)创建Topic来验证是否创建成功

#创建Topic
[root@k1 bin]# ./kafka-topics.sh --create --bootstrap-server 192.168.207.131:9092 --replication-factor 2 --partitions 2 --topic topic_jyc01

WARNING: Due to limitations in metric names, topics with a period ('.') or underscore ('_') could collide. To avoid issues it is best to use either, but not both.

Created topic topic_jyc01.

[root@k1 bin]# ./kafka-topics.sh --list --bootstrap-server 192.168.207.132:9092

topic_jyc01

#解释
--replication-factor 2   #复制两份
--partitions 2 #创建2个分区
--topic #主题为topic_jyc01

生产者:

[root@k1 bin]# ./kafka-console-producer.sh --broker-list "192.168.207.131:9092,192.168.207.132:9092,192.168.207.133:9092" --topic topic_jyc01

>Hello Kafka!

>你好 kafka!

>test

>

消费者:

[root@k1 bin]# ./kafka-console-consumer.sh --bootstrap-server "192.168.207.131:9092,192.168.207.132:9092,192.168.207.133:9092" --topic topic_jyc01

Hello Kafka!

你好 kafka!

test

可正常收到信息:

https://i-blog.csdnimg.cn/direct/210bfec3ae344bf783d6ebbab55afb87.png

2.4安装Kafka Eagle

Kafka Eagle是一款 Kafka 可视化和管理软件,支持对多个不同版本的 Kafka 集群进行管理。Kafka Eagle可以监控 Kafka 集群的健康状态,消费者组的消费情况,创建和删除 Topic,支持使用 KSQL 对 Kafka 消息做 Ad-hoc 查询,支持多种告警方式等等。

2.4.1下载并解压到指定路径:

EFAK

mkdir –p /opt/kafka-web

cd /opt/kafka-web

tar -zxvf kafka-eagle-bin-3.0.1.tar.gz

/etc/profile文件末尾添加如下环境变量,并执行source /etc/profile生效:

export KE_HOME=/opt/kafka-web/efak-web-3.0.1

export PATH=$PATH:$KE_HOME/bin

2.4.2修改配置文件server.properties:

mkdir -p /opt/kafka-web/db

[root@k1 config]# cd /opt/kafka-web

[root@k1 kafka-web]# ls

db  efak-web-3.0.1

[root@k1 kafka-web]# cd efak-web-3.0.1/

[root@k1 efak-web-3.0.1]# ll

total 0

drwxr-xr-x.  2 root root  66 Sep 19 17:08 bin

drwxr-xr-x.  2 root root 112 Sep 20 09:25 conf

drwxr-xr-x.  2 root root   6 Sep 13  2021 db

drwxr-xr-x.  2 root root  23 Sep 19 16:46 font

drwxr-xr-x. 10 root root 103 Sep 19 17:33 kms

drwxr-xr-x.  2 root root 128 Sep 20 08:58 logs

[root@k1 efak-web-3.0.1]# cd conf

[root@k1 conf]# ll

total 16

-rw-r--r--. 1 root root 2217 Sep 13  2021 log4j.properties

-rw-r--r--. 1 root root 4295 Sep 19 17:04 system-config.properties

-rw-r--r--. 1 root root    9 Sep 13  2021 works

#修改红色的内容

[root@k1 conf]# more system-config.properties |grep -v "^$"|grep -v "#"

efak.zk.cluster.alias=cluster1

cluster1.zk.list=192.168.207.131:12181,192.168.207.132:12181,192.168.207.133:12181

cluster1.zk.acl.enable=false

cluster1.zk.acl.schema=digest

cluster1.zk.acl.username=test

cluster1.zk.acl.password=test123

cluster1.efak.broker.size=20

kafka.zk.limit.size=16

efak.webui.port=8048

efak.distributed.enable=false

efak.cluster.mode.status=master

efak.worknode.master.host=localhost

efak.worknode.port=8085

cluster1.efak.jmx.acl=false

cluster1.efak.jmx.user=keadmin

cluster1.efak.jmx.password=keadmin123

cluster1.efak.jmx.ssl=false

cluster1.efak.jmx.truststore.location=/data/ssl/certificates/kafka.truststore

cluster1.efak.jmx.truststore.password=ke123456

cluster1.efak.offset.storage=kafka

cluster2.efak.offset.storage=zk

cluster1.efak.jmx.uri=service:jmx:rmi:///jndi/rmi://%s/jmxrmi

efak.metrics.charts=true

efak.metrics.retain=15

efak.sql.topic.records.max=5000

efak.sql.topic.preview.records.max=10

efak.topic.token=keadmin

cluster1.efak.sasl.enable=false

cluster1.efak.sasl.protocol=SASL_PLAINTEXT

cluster1.efak.sasl.mechanism=SCRAM-SHA-256

cluster1.efak.sasl.jaas.config=org.apache.kafka.common.security.scram.ScramLoginModule required username="kafka" password="kafka-eagle";

cluster1.efak.sasl.client.id=

cluster1.efak.blacklist.topics=

cluster1.efak.sasl.cgroup.enable=false

cluster1.efak.sasl.cgroup.topics=

cluster2.efak.sasl.enable=false

cluster2.efak.sasl.protocol=SASL_PLAINTEXT

cluster2.efak.sasl.mechanism=PLAIN

cluster2.efak.sasl.jaas.config=org.apache.kafka.common.security.plain.PlainLoginModule required username="kafka" password="kafka-eagle";

cluster2.efak.sasl.client.id=

cluster2.efak.blacklist.topics=

cluster2.efak.sasl.cgroup.enable=false

cluster2.efak.sasl.cgroup.topics=

cluster3.efak.ssl.enable=false

cluster3.efak.ssl.protocol=SSL

cluster3.efak.ssl.truststore.location=

cluster3.efak.ssl.truststore.password=

cluster3.efak.ssl.keystore.location=

cluster3.efak.ssl.keystore.password=

cluster3.efak.ssl.key.password=

cluster3.efak.ssl.endpoint.identification.algorithm=https

cluster3.efak.blacklist.topics=

cluster3.efak.ssl.cgroup.enable=false

cluster3.efak.ssl.cgroup.topics=

efak.driver=org.sqlite.JDBC

efak.url=jdbc:sqlite:/opt/kafka-web/db/ke.db

efak.username=root

efak.password=www.kafka-eagle.org

2.4.3启动服务:

[root@k1 bin]# pwd

/opt/kafka-web/efak-web-3.0.1/bin

[root@k1 bin]# ll

total 28

-rw-r--r--. 1 root root  1848 Sep 13  2021 ke.bat

-rw-r--r--. 1 root root     6 Sep 19 17:33 ke.pid

-rwxr-xr-x. 1 root root 11289 Dec 12  2021 ke.sh

-rwxr-xr-x. 1 root root  4776 Dec 12  2021 worknode.sh

[root@k1 bin]# ./ke.sh start

输出日志最后会提示登录的地址和用户名密码。

浏览器登录管理控制台:

http://192.168.207.131:8048

admin/123456

3.日常启停顺序:

停止:

先停止kafka再停止zookeeper:

/opt/kafka/kafka_2.13-3.8.0/bin/kafka-server-stop.sh -daemon /opt/kafka/kafka_2.13-3.8.0/config/server.properties

/opt/zookeeper/zookeeper-3.9.2/bin/zkServer.sh stop

启动:

先启动zookeeper,再启动kafka:

/opt/zookeeper/zookeeper-3.9.2/bin/zkServer.sh start

/opt/kafka/kafka_2.13-3.8.0/bin/kafka-server-start.sh -daemon /opt/kafka/kafka_2.13-3.8.0/config/server.properties

检查:

jps

测试发布和消费:

发布:

/opt/kafka/kafka_2.13-3.8.0/bin/kafka-console-producer.sh --broker-list "192.168.207.131:9092,192.168.207.132:9092,192.168.207.133:9092" --topic topic_jyc01 --property parse.key=true

注意使用tab键分隔内容输入后回车

>jyc    test

>a      a

>b      c

ctrl+c取消退出

消费:

/opt/kafka/kafka_2.13-3.8.0/bin/kafka-console-consumer.sh --bootstrap-server "192.168.207.131:9092,192.168.207.132:9092,192.168.207.133:9092" --topic topic_jyc01

4.参考文档:

Kafka 生产环境部署指南-阿里云开发者社区

kafka-eagle无法获取kafka cluster info-CSDN博客

Kafka【第一篇】Kafka集群搭建_kafka 集群-CSDN博客


http://www.kler.cn/news/312798.html

相关文章:

  • 如何确保Java程序分发后不被篡改?使用JNI对Java程序进行安全校验
  • Linux C# DAY3
  • 道路裂缝,坑洼,病害数据集-包括无人机视角,摩托车视角,车辆视角覆盖道路
  • 超级Prompt!
  • linux网络编程4
  • 定义可引用的 CI/CD 配置文件中的输入参数
  • 【笔记】自动驾驶预测与决策规划_Part3_路径与轨迹规划
  • 中国IT产业新挑战与机遇共存
  • 【使用Hey对vllm接口压测】模型并发能力
  • ATE自动化测试系统集成:软件与硬件的技术结合
  • 迭代器和生成器的学习笔记
  • JVM 运行时数据区详解(下)
  • Windows通过网线传文件
  • Spring Boot整合MyBatis Plus详解
  • 二级C语言2023-9易错题
  • 反游戏学(Reludology):概念、历史、现状与展望?(豆包AI版)
  • mac 怎么查看CPU核数
  • 通过UV快速计算品牌独立站网络流量
  • 【算法】BFS 系列之 多源 BFS
  • Unity之FPS
  • 谷粒商城のElasticsearch
  • 优先级队列(堆)
  • 行业分析---自动驾驶行业的发展
  • MySQL定长窗口SQL
  • Spring为什么要用三级缓存解决循环依赖?
  • 微服务之服务注册与发现:Etcd、Zookeeper、Consul 与 Nacos 比较
  • libmodbus:写一个modbusTCP服务
  • 求Huffman树及其matlab程序详解
  • RabbitMQ 常见使用模式详解
  • Delta Lake