当前位置：首页 > article >正文

flume系列之：出现数据堆积时临时增大sink端消费能力

article 2025/3/10 15:28:51

flume系列之：出现数据堆积时临时增大sink端消费能力

一、背景
二、增大sink端消费能力

flume系列之：flume生产环境sink重要参数理解

一、背景

flume出现数据堆积，消费的数据持续堆积在channel中
参数org_apache_flume_channel_channel1_channelfillpercentage的值大于0，并且持续增长，表明source端消费的数据，sink端无法及时同步到hdfs上
现在需要加快sink端消费数据的能力，从而保证数据快速消化完

二、增大sink端消费能力

适当调大下面参数的值：

sinks.sink1.hdfs.maxOpenFiles = 9000
设置HDFS Sink插件同时打开的最大文件数。系统的磁盘和内存资源充足，并且需要同时写入大量的文件，可以适当增大该参数的值。系统资源有限或写入的文件较少，可以减小该参数的值。
sinks.sink1.hdfs.threadsPoolSize = 500
设置HDFS Sink插件的线程池大小。该参数的值决定了可以并行处理的任务数。系统的CPU核心数较多，并且

http://www.kler.cn/a/316824.html

相关文章：

LAMP环境搭建记录：基于VM的Ubuntu虚拟机

编译成功！QT/6.7.2/Creator编译Windows64 MySQL驱动(MSVC版)

（学习记录）使用 STM32CubeMX——GPIO引脚输入配置

实时数据的处理一致性

JavaScript（JS）学习笔记 3（DOM简介事件简介元素修改节点操作事件操作）

MySQL：事务隔离级别

Kubernets基础-包管理工具Helm详解

计算机组成原理==初识二进制运算

Redisson分布式锁主从一致性问题

CentOS修改主机名

【已解决】如何使用JAVA 语言实现二分查找-二分搜索折半查找【算法】手把手学会二分查找【数据结构与算法】

用Qt 对接‌百度AI平台

响应式流规范

胤娲科技：谷歌DeepMind祭出蛋白质设计新AI——癌症治疗迎来曙光

DoppelGanger++：面向数据库重放的快速依赖关系图生成

JavaScript语法特点

linux 使用mdadm 创建raid0 nvme 磁盘

深入理解SpringBoot（一）----SpringBoot的启动流程分析

邮储银行：面向金融行业的移动应用安全风险监测案例

【docker】命令之容器操作