当前位置：首页 > article >正文

prometheus + alertmanager + grafana 监控拓扑图

article 2025/3/28 10:54:15

各服务说明

Prometheus Operator：负责管理 Prometheus 和 Alertmanager 集群的部署和配置。
Prometheus 实例：负责定时抓取（scrape）集群中各个 Exporter（如 node-exporter、kube-state-metrics、blackbox-exporter 等）的指标数据，并根据定义的告警规则生成报警。
Alertmanager 实例：接收 Prometheus 发出的报警信息，并进行聚合、抑制和路由。
Grafana：作为数据可视化工具，通过 Prometheus 提供的 API 显示仪表盘。
kube-state-metrics：提供 Kubernetes 集群状态数据。
node-exporter：部署在每个 Node 上，采集节点级别的系统指标。
其他 Exporter（如 blackbox-exporter）：用于检测外部服务可用性等。

网络拓扑图

图示说明

Prometheus Operator：负责监控和管理 Prometheus 和 Alertmanager 的生命周期和配置。
Prometheus Instances：定时从 kube-state-metrics、node-exporter、其他 Exporter 中抓取指标，并评估告警规则。
Alertmanager Instances：对 Prometheus 发出的告警信息进行管理，包括聚合、抑制以及通过邮件、Webhook 等方式通知用户。
Grafana：作为前端仪表盘，查询 Prometheus 中的指标数据并展示。
外部用户：通过 Ingress 或 LoadBalancer 访问 Grafana 仪表盘。

查看全文

http://www.kler.cn/a/599917.html