当前位置: 首页 > article >正文

云原生之运维监控实践-使用Prometheus与Grafana实现对Nginx和Nacos服务的监测

背景

如果你要为应用程序构建规范或用户故事,那么务必先把应用程序每个组件的监控指标考虑进来,千万不要等到项目结束或部署之前再做这件事情。——《Prometheus监控实战》

去年写了一篇在Docker环境下部署若依微服务ruoyi-cloud项目的文章,当时使用的是 docker-compose 在单台机器上部署若依微服务 ruoyi-cloud 项目;在这个基础上,作为演示项目,我们计划实现对所有基础组件和微服务的监控。之前记录了搭建 PrometheusGrafana 监控系统的过程。今天这篇文章主要是记录下对 NginxNacos 服务的监测,用到的 exporter 是: nginx-prometheus-exporterNacos 自带了一个用于监控的内置端点。

虚机资源

共用到了2台虚机,1台作为应用服务节点,1台运维监控节点。

主机名IP说明
svc192.168.44.168服务节点
ops192.168.44.169监控节点

基本选用当前最新版本,即将安装的 PrometheusGrafana 及组件版本信息如下:

  • Prometheus版本:v2.54.1
  • Grafana版本:11.2.0
  • nginx-prometheus-exporter版本:v1.3.0

系统环境

[root@ops ~]# uname -a
Linux ops 5.10.0-182.0.0.95.oe2203sp3.x86_64 #1 SMP Sat Dec 30 13:10:36 CST 2023 x86_64 x86_64 x86_64 GNU/Linux
[root@ops ~]# cat /proc/version
Linux version 5.10.0-182.0.0.95.oe2203sp3.x86_64 (root@dc-64g.compass-ci) (gcc_old (GCC) 10.3.1, GNU ld (GNU Binutils) 2.37) #1 SMP Sat Dec 30 13:10:36 CST 2023

ops节点:docker-compose安装Prometheus与Grafana

参考云原生之运维监控实践-OpenEuler22.03SP3上安装Prometheus与Grafana实现主机状态监测

svc节点:docker-compose安装nginx-prometheus-exporter

有了 PrometheusGrafana 的基础环境,我们来实现对 Nginx 状态的监控:通过 nginx-prometheus-exporter 快速采集 Nginx 运行数据(如请求数、连接数、响应时间等)并以 Prometheus 格式提供,供 Prometheus 进行采集和分析。

2024-11-16-1-NginxExporterVersion.jpg

验证Nginx的指标端点

命令行输入:

nginx -V 2>&1 | grep -o with-http_stub_status_module
  • 如果在终端中输出with-http_stub_status_module,则说明Nginx已启用stub_status模块。
  • 如果未输出任何结果,则可以使用–with-http_stub_status_module参数从源码重新配置编译Nginx。

在安装 nginx-prometheus-exporter 之前,需要先在 Nginx 的配置文件中开放 stub_status 端点。

    location = /stub_status { # 具体路径可根据业务情况进行调整
            stub_status;
    }

浏览器访问验证端点:http://192.168.44.168/stub_status

Active connections: 60 
server accepts handled requests
 86247 86247 113387 
Reading: 0 Writing: 5 Waiting: 55 

安装nginx-prometheus-exporter

在需要监测的主机上,编辑 docker-compose.yml 文件,增加安装 nginx-prometheus-exporter 配置。

  • [root@svc monitoring]# vi docker-compose.yml
version: '3'
services:
  ops-nginx-exporter:
    container_name: ops-nginx-exporter
    image: nginx/nginx-prometheus-exporter:1.3.0
    networks:
      - custom_network
    environment:
      SCRAPE_URI: http://192.168.44.168/stub_status
    ports:
      - "9113:9113"
    restart: unless-stopped

通过命令: docker-compose up -d 完成镜像拉取、并启动 ops-nginx-exporter 服务。

修改Prometheus配置

Prometheus 配置中增加对svc主机上 Nginx 运行状态的抓取配置。

  • [root@ops monitoring]# vi ./prometheus/conf/prometheus.yml
scrape_configs:
  - job_name: 'ops-nginx'
    scrape_interval: 15s
    static_configs:
      - targets:
        - 192.168.44.168:9113   

重启 Prometheus 容器。

[root@ops monitoring]# docker restart ops-prometheus

验证nginx-prometheus-exporter安装结果

  • 浏览器验证metrics端点

浏览器访问http://192.168.44.168:9113/metrics

  • Prometheus控制台验证nginx相关的指标

2024-11-16-2-NginxIndex.jpg

配置Grafana对主机状态的可视化

浏览器访问http://192.168.44.169:3000。

  • 配置数据源
  1. 点击左侧菜单中的"Add new connection"。
  2. 选择或搜索"Data Sources"。
  3. 点击"Add data source"并选择"Prometheus"。
  4. 在"HTTP"部分输入Prometheus地址,eg:http://192.168.44.169:9090
  5. 点击"Save & Test"确认连接成功。
  • 查看现成的仪表板

https://grafana.com/grafana/dashboards/这个页面是 Grafana 的官方仪表板目录,用户可以在这里找到和共享各种现成的 Grafana 仪表板。这些仪表板覆盖了多种监控需求,包括系统性能、应用监控、网络流量等。用户可以根据自己的需求搜索和导入适合的仪表板,提高监控效率和可视化效果。这里我们搜索 Nginx ,结果中有个 NGINX by nginxinc ,点击进去可以查看详细的UI效果,复制仪表板的id,此处是11199。

  • 导入现成的仪表板
  1. 在右侧菜单中点击"New"按钮,然后选择"Import"。
  2. 在输入框中,可以直接输入现成仪表板的ID,或者上传JSON文件。常用的主机监控仪表板ID是11199(NGINX by nginxinc)。
  3. 点击"Load",随后选择已配置好的数据源。
  4. 点击"Import"完成导入。

2024-11-16-3-NginxImport.jpg

Nginx监控效果

2024-11-16-4-NginxDashboard.jpg

svc节点:Nacos服务

无需 exporterNacos 提供了一个用于监控的内置端点,可以通过该端点获取 Nacos 的各种监控指标,并将其暴露给 Prometheus 进行采集和存储。 Nacos 本身是一个 SpringBoot 应用,通过内置的监控端点 /actuator/prometheus 可以获取 Nacos 的各种监控指标,包括服务注册与发现的状态、配置管理的信息、健康检查的结果等。

修改Prometheus配置

Prometheus 配置中增加对svc主机上 Nacos 运行状态的抓取配置。

  • [root@ops monitoring]# vi ./prometheus/conf/prometheus.yml
scrape_configs:
  - job_name: 'ops-nacos'
    metrics_path: '/nacos/actuator/prometheus'
    scrape_interval: 15s
    static_configs:
      - targets:
        - 192.168.44.168:8848

重启 Prometheus 容器。

[root@ops monitoring]# docker restart ops-prometheus

验证nacos指标端点

  • 浏览器验证metrics端点

浏览器访问http://192.168.44.168:8848/nacos/actuator/prometheus

  • Prometheus控制台验证nacos相关的指标

2024-11-16-5-NacosIndex.jpg

配置Grafana对主机状态的可视化

浏览器访问http://192.168.44.169:3000。

  • 配置数据源
  1. 点击左侧菜单中的"Add new connection"。
  2. 选择或搜索"Data Sources"。
  3. 点击"Add data source"并选择"Prometheus"。
  4. 在"HTTP"部分输入Prometheus地址,eg:http://192.168.44.169:9090
  5. 点击"Save & Test"确认连接成功。
  • 查看现成的仪表板

https://grafana.com/grafana/dashboards/这个页面是 Grafana 的官方仪表板目录,用户可以在这里找到和共享各种现成的 Grafana 仪表板。这些仪表板覆盖了多种监控需求,包括系统性能、应用监控、网络流量等。用户可以根据自己的需求搜索和导入适合的仪表板,提高监控效率和可视化效果。这里我们搜索 Nacos ,结果中有个 Nacos ,点击进去可以查看详细的UI效果,复制仪表板的id,此处是13221。

  • 导入现成的仪表板
  1. 在右侧菜单中点击"New"按钮,然后选择"Import"。
  2. 在输入框中,可以直接输入现成仪表板的ID,或者上传JSON文件。常用的主机监控仪表板ID是13221(Nacos)。
  3. 点击"Load",随后选择已配置好的数据源。
  4. 点击"Import"完成导入。

2024-11-16-6-NacosImport.jpg

Nacos监控效果

2024-11-16-7-NacosDashboard.jpg

小总结

If you can’t measure it, you can’t improve it!

没有度量就没有改进,实际上,监控系统有以下两个客户:技术,业务。上述内容即是对技术组件的监控,方便技术方面的改进与优化。
本文记录了在 Docker 环境下通过 PrometheusGrafana 实现对 NginxNacos 服务的监控。具体步骤包括在服务节点上使用 docker-compose 安装 nginx-prometheus-exporter ,配置 Prometheus 抓取 NginxNacos 的监控数据,并在 Grafana 中配置数据源和导入现成的监控仪表板,以实现对反向代理服务和注册中心服务的性能监控和可视化。

Reference

  • https://github.com/nginxinc/nginx-prometheus-exporter/releases
  • https://grafana.com/grafana/dashboards/

If you have any questions or any bugs are found, please feel free to contact me.

Your comments and suggestions are welcome!


http://www.kler.cn/a/397021.html

相关文章:

  • Python练习27
  • 大学语文教材电子版(第十一版)教学用书PDF及课件
  • RabbitMQ实战启程:从原理到部署的全方位探索(上)
  • AlphaFold3中文使用说明
  • 【数据结构】线性表——栈与队列
  • redis linux 安装
  • 十九:Spring Boot 依赖(4)-- spring-boot-starter-security依赖详解
  • 【DM系列】详解 DM 字符串大小写敏感
  • ldconfig 和 LD_LIBRARY_PATH 区别
  • 虎扑APP数据采集:JavaScript与AJAX的结合使用
  • QT使用libssh2库实现sftp文件传输
  • C语言和C++的常量概念与区别分析
  • HarmonyOS SDK下的实践与探索
  • 小U的相似字符串 | 模拟
  • 【MYSQL】分库分表
  • Mysql中REPLACE INTO详解及和INSERT INTO的区别
  • 【Goland】——Gin 框架中的路由与请求处理
  • Solana 区块链的技术解析及未来展望 #dapp开发#公链搭建
  • async 和 await的使用
  • 分别写出在散列表中插入和删除关键字为K的一个记录的算法,设散列函数为H,解决冲突的方法为链地址法。
  • 蓝桥杯模拟
  • 动态规划 —— 子数组系列-乘积为正数的最长子数组长度
  • arkUI:水果选择与管理:基于 ArkUI 的长按编辑功能实现
  • 基于RK3568J多网口电力可信物联网关解决方案
  • leetcode day10 动态规划篇 64+139
  • 通过JS实现下载图片到本地教程分享