当前位置: 首页 > article >正文

flume系列之:出现数据堆积时临时增大sink端消费能力

flume系列之:出现数据堆积时临时增大sink端消费能力

  • 一、背景
  • 二、增大sink端消费能力

flume系列之:flume生产环境sink重要参数理解

一、背景

  • flume出现数据堆积,消费的数据持续堆积在channel中
  • 参数org_apache_flume_channel_channel1_channelfillpercentage的值大于0,并且持续增长,表明source端消费的数据,sink端无法及时同步到hdfs上
  • 现在需要加快sink端消费数据的能力,从而保证数据快速消化完

二、增大sink端消费能力

适当调大下面参数的值:

  • sinks.sink1.hdfs.maxOpenFiles = 9000

  • 设置HDFS Sink插件同时打开的最大文件数。系统的磁盘和内存资源充足,并且需要同时写入大量的文件,可以适当增大该参数的值。系统资源有限或写入的文件较少,可以减小该参数的值。

  • sinks.sink1.hdfs.threadsPoolSize = 500

  • 设置HDFS Sink插件的线程池大小。该参数的值决定了可以并行处理的任务数。系统的CPU核心数较多,并且


http://www.kler.cn/news/316824.html

相关文章:

  • LAMP环境搭建记录:基于VM的Ubuntu虚拟机
  • 编译成功!QT/6.7.2/Creator编译Windows64 MySQL驱动(MSVC版)
  • (学习记录)使用 STM32CubeMX——GPIO引脚输入配置
  • 实时数据的处理一致性
  • JavaScript(JS)学习笔记 3(DOM简介 事件简介 元素修改 节点操作 事件操作)
  • MySQL:事务隔离级别
  • Kubernets基础-包管理工具Helm详解
  • 计算机组成原理==初识二进制运算
  • Redisson分布式锁主从一致性问题
  • CentOS修改主机名
  • 【已解决】如何使用JAVA 语言实现二分查找-二分搜索折半查找【算法】手把手学会二分查找【数据结构与算法】
  • 用Qt 对接‌百度AI平台
  • 响应式流规范
  • 胤娲科技:谷歌DeepMind祭出蛋白质设计新AI——癌症治疗迎来曙光
  • DoppelGanger++:面向数据库重放的快速依赖关系图生成
  • JavaScript语法特点
  • linux 使用mdadm 创建raid0 nvme 磁盘
  • 深入理解SpringBoot(一)----SpringBoot的启动流程分析
  • 邮储银行:面向金融行业的移动应用安全风险监测案例
  • 【docker】命令之容器操作
  • C++:布尔类型,引用,堆区空间
  • 力扣232:用栈实现队列
  • 【Proteus仿真】基于51单片机的宠物喂食系统设计
  • JSON合并工具
  • JVM-类加载器的双亲委派模型详解
  • 前后端数据交互 笔记03(get和post方法)
  • 使用 Azure Functions 开发 Serverless 应用:详解与实战
  • LeetCode 1014. 最佳观光组合 一次遍历数组,时间复杂度O(n)
  • 【matlab】将程序打包为exe文件(matlab r2023a为例)
  • Linux文件IO(三)-Linux系统如何管理文件