当前位置: 首页 > article >正文

生产环境中:Flume 与 Prometheus 集成

        在生产环境中,将 Apache Flume 与 Prometheus 集成的过程,需要借助 JMX Exporter 或 HTTP Exporter 来将 Flume 的监控数据转换为 Prometheus 格式。以下是详细的实现方法,连同原理和原因进行逐步解释,让刚接触的初学者也能完成集成。


原理和概念

  1. Flume 的监控数据来源
    Flume 会暴露监控指标(如事件接收速率、Channel 容量等):

    • 通过 JMX(Java Management Extensions):用于 Java 应用的标准监控接口。
    • 通过 HTTP:通过 REST API 提供 JSON 格式的监控数据。
  2. Prometheus 的数据抓取方式
    Prometheus 定期从指定目标抓取监控指标。这些目标需要返回 Prometheus 可读的 Metrics 格式数据key value 格式)。

  3. JMX Exporter 和 HTTP Exporter 的作用

    • JMX Exporter:将 Flume 的 JMX 数据转换为 Prometheus 格式。
    • HTTP Exporter:将 Flume 的 HTTP 数据转换为 Prometheus 格式。

        通过上述工具,可以让 Flume 的监控数据被 Prometheus 定期抓取,从而实现可视化和报警功能。


实现步骤:使用 JMX Exporter 集成

1. 下载并配置 JMX Exporter

  1. 下载 JMX Exporter
    到 Prometheus JMX Exporter 的 GitHub 页面,下载 JAR 包:

    wget https://repo1.maven.org/maven2/io/prometheus/jmx/jmx_prometheus_javaagent/0.17.2/jmx_prometheus_javaagent-0.17.2.jar
    
  2. 创建配置文件
    创建一个 YAML 文件(如 jmx_config.yml),定义需要监控的指标。示例内容如下:

    rules:
      - pattern: ".*"
        name: "flume_$1"
        type: "GAUGE"
        labels:
          component: "$2"
    

    原因

    • rules 定义了哪些 JMX 指标会被暴露。
    • pattern 通过正则表达式匹配 JMX 属性。
    • name 定义 Prometheus 的指标名称。

2. 修改 Flume 启动脚本

为了让 Flume 支持 JMX Exporter,需要在其 JVM 启动参数中添加 JMX Exporter 的代理配置。

  1. 找到 Flume 启动脚本
    通常位于$FLUME_HOME/bin/flume-ng. 

  2. 修改启动参数
    编辑 flume-ng,找到包含 JAVA_OPTS 的部分,加入以下内容:

    JAVA_OPTS="$JAVA_OPTS -javaagent:/path/to/jmx_prometheus_javaagent-0.17.2.jar=12345:/path/to/jmx_config.yml"
    

    解释(按照自己的实际需要修改)

    • -javaagent:指定加载的代理 JAR。
    • 12345:JMX Exporter 监听的端口。
    • /path/to/jmx_config.yml:JMX Exporter 的配置文件路径。
  3. 重启 Flume

    bin/flume-ng agent -n <agent-name> -c conf -f <config-file>
    

3. 配置 Prometheus

  1. 修改 Prometheus 配置文件prometheus.yml):
    添加以下内容,将 JMX Exporter 的地址作为抓取目标:

    scrape_configs:
      - job_name: 'flume'
        static_configs:
          - targets: ['<flume-host>:12345']
    

    解释

    • job_name:为监控任务命名。
    • targets:Flume 所在机器的 IP 和 JMX Exporter 的端口。
  2. 重启 Prometheus

    systemctl restart prometheus
    
  3. 验证
    在 Prometheus 的 Web 界面(默认 http://<prometheus-host>:9090 )中搜索 flume_*,可以看到 Flume 的监控数据。


实现步骤:使用 HTTP Exporter 集成

如果不想使用 JMX,Flume 自带的 HTTP 监控端口也可以用来集成 Prometheus。

1. 启用 Flume HTTP 监控

  1. 确认 Flume HTTP 端口
    默认情况下,Flume 会在 41414 端口上暴露监控数据。可以在 Flume 配置文件(flume.conf)中检查:

    agent.monitoring.type=http
    agent.monitoring.port=41414
    
  2. 重启 Flume

    bin/flume-ng agent -n <agent-name> -c conf -f <config-file>
    
  3. 验证 HTTP 输出
    访问 http://<flume-host>:41414/metrics,可以看到 JSON 格式的监控数据。


2. 使用 HTTP Exporter 转换数据

Prometheus 不能直接抓取 JSON 数据,需要使用 HTTP Exporter 转换成 Prometheus 格式。

  1. 部署 HTTP Exporter
    下载并运行 HTTP Exporter(如 json_exporter)。

    wget https://github.com/prometheus-community/json_exporter/releases/download/v0.5.0/json_exporter-0.5.0.linux-amd64.tar.gz
    tar -xvzf json_exporter-0.5.0.linux-amd64.tar.gz
    
  2. 创建 HTTP Exporter 配置
    创建 config.yml 文件,定义 JSON 转换规则:

    metrics:
      - name: flume_events_received
        path: $.Source.EventReceived
        type: GAUGE
      - name: flume_channel_size
        path: $.Channel.ChannelSize
        type: GAUGE
    

    解释

    • path 定义了 JSON 数据中监控指标的位置(使用 JSONPath 语法)。
    • name 定义 Prometheus 的指标名称。
  3. 运行 HTTP Exporter

    ./json_exporter --config.file=config.yml --listen-address=":9100"
    

3. 配置 Prometheus

  1. 修改 Prometheus 配置文件

    scrape_configs:
      - job_name: 'flume-http'
        static_configs:
          - targets: ['<exporter-host>:9100']
    
  2. 重启 Prometheus

    systemctl restart prometheus
    
  3. 验证
    在 Prometheus 界面中搜索 flume_* ,可以看到 Flume 的 HTTP 数据。


总结

通过以上步骤,可以实现 Flume 到 Prometheus 的监控集成:

  1. 如果使用 JMX Exporter,修改 Flume 启动参数,直接暴露 JMX 数据。
  2. 如果使用 HTTP Exporter,将 Flume 的 HTTP 数据转换成 Prometheus 可读的格式。

        在生产环境中,推荐 JMX Exporter,因其性能更高,配置更灵活。而 HTTP Exporter 则适合无法直接使用 JMX 的场景。无论哪种方式,都能实现 Flume 的指标采集、报警和可视化。


http://www.kler.cn/a/417854.html

相关文章:

  • Day2 生信新手笔记: Linux基础
  • 触觉智能亮相OpenHarmony人才生态大会2024
  • Mybatis 支持延迟加载的详细内容
  • 爬虫框架快速入门——Scrapy
  • GoogleTest做单元测试
  • 卸载 Archiconda
  • C# 字节流 与 StreamReader 读取 Json 格式文件内容并处理的函数
  • Redis主从架构
  • 远离网上的广告和无用信息,自己动手搭建Tipask问答网站
  • 6、将机器人移动到指定关节角度或位置
  • IDEA:配置Serializable class without ‘serialVersionUID’ 找不到
  • Rust编程语言代码详细运行、编译方法
  • 日程公布 | 西部地区生活物资保供与城郊大仓基地高质量建设运营论坛(12月5日·西安)
  • 一文了解TensorFlow是什么
  • Docker:清理Docker占用的磁盘空间
  • PostgreSQL详细安装教程
  • 【ROS2】ROS2 C++版本 与 Python版本比较
  • 数据结构4——栈和队列
  • 救生艇..
  • HOG 算法变形:原理、应用与创新发展
  • 行业分析---2024年蔚来汽车三季度财报及科技日
  • [C#] 对图像进行垂直翻转(FlipY)的跨平台SIMD硬件加速向量算法,兼谈并行处理收益极少的原因
  • 155. TWEEN.JS点按钮,相机飞行靠近观察设备
  • Fastadmin系统配置增加配置字段类型
  • 《安富莱嵌入式周报》第346期:开源2GHz带宽,12bit分辨率,3.2Gsps采样率示波,开源固件安全分析器, 开源口袋电源,开源健康测量,FreeCAD
  • Z2400024基于Java+SSM+mysql+maven开发的社区论坛系统的设计与实现(附源码 配置 文档)