prometheus + alertmanager + grafana 监控拓扑图
各服务说明
- Prometheus Operator:负责管理 Prometheus 和 Alertmanager 集群的部署和配置。
- Prometheus 实例:负责定时抓取(scrape)集群中各个 Exporter(如 node-exporter、kube-state-metrics、blackbox-exporter 等)的指标数据,并根据定义的告警规则生成报警。
- Alertmanager 实例:接收 Prometheus 发出的报警信息,并进行聚合、抑制和路由。
- Grafana:作为数据可视化工具,通过 Prometheus 提供的 API 显示仪表盘。
- kube-state-metrics:提供 Kubernetes 集群状态数据。
- node-exporter:部署在每个 Node 上,采集节点级别的系统指标。
- 其他 Exporter(如 blackbox-exporter):用于检测外部服务可用性等。
网络拓扑图
图示说明
- Prometheus Operator:负责监控和管理 Prometheus 和 Alertmanager 的生命周期和配置。
- Prometheus Instances:定时从 kube-state-metrics、node-exporter、其他 Exporter 中抓取指标,并评估告警规则。
- Alertmanager Instances:对 Prometheus 发出的告警信息进行管理,包括聚合、抑制以及通过邮件、Webhook 等方式通知用户。
- Grafana:作为前端仪表盘,查询 Prometheus 中的指标数据并展示。
外部用户:通过 Ingress 或 LoadBalancer 访问 Grafana 仪表盘。