七、Prometheus 黑盒监控-白盒监控
黑盒监控:监控关注的是现象,也就是正在发生的告警,比如某个网站突然慢了,或者是打不开了。此类告警是站在用户的角度看到的东西,比较关注现象,表示正在发生的问题,这类监控称为黑盒监控。
白盒监控:程序内部的一些指标,这类监控专注的点是原因,也就是一般为出现问题的根本,此类监控称为白盒监控,主要关注的是原因。
在 Prometheus 监控体系中,黑盒监控(Blackbox Monitoring) 和 白盒监控(Whitebox Monitoring) 是两种不同的监控方式,适用于不同的场景。下面详细介绍它们的概念、对比、实现方式以及应用场景。
一、黑盒监控(Blackbox Monitoring)
1. 概念
黑盒监控是一种外部监控方式,它不需要了解被监控系统的内部结构,而是通过外部探测的方式来检查服务的可用性、响应时间和状态。例如:
- HTTP/HTTPS 监控(检测 Web 服务是否正常)
- TCP 监控(检测端口是否开放)
- ICMP 监控(PING 探测网络连通性)
- DNS 监控(检测 DNS 解析是否正常)
黑盒监控的典型工具是 Prometheus Blackbox Exporter,它通过模拟用户访问方式,探测系统或网络服务的可用性和响应情况。
2. 特点
- 不需要访问应用内部,仅通过外部探测评估服务可用性。
- 适用于 SLA 监控,比如网站是否能访问、接口是否返回 200 状态码。
- 通常用于监控外部服务、网络连通性、API 健康检查等。
3.实现方式
-
部署 Blackbox Exporter
- Blackbox Exporter 是一个独立的组件,可以作为 Prometheus 的目标(Target),负责探测 URL、TCP 端口等。
-
配置 Prometheus 采集 Blackbox Exporter
- 通过
http_sd_config
或file_sd_config
配置 Prometheus 采集 Blackbox Exporter 提供的指标。
- 通过
-
查询和报警
-
通过 PromQL 查询监控数据,例如:
probe_success == 0 # 失败 probe_success == 1 # 成功
probe_success == 0 该表达式用于检测某个探测任务失败时触发报警。
-
4. 应用场景
- 监控 Web 站点的可用性(如
https://example.com
是否正常) - 检测 API 响应时间(如
/healthz
接口返回是否超时) - 监控数据库端口连通性(如 MySQL 3306 是否正常)
- 监测 DNS 解析是否工作正常
- 探测 ICMP(Ping)连通性
5. 查看现有版本
新版 Prometheus Stack 已经默认安装了 BlackboxExporter,可以通过以下命令查看:
[root@k8s-master01 ~]#kubectl get po -n monitoring -l app.kubernetes.io/name=blackbox-exporter
NAME READY STATUS RESTARTS AGE
blackbox-exporter-779cfb44dd-4cqcs 3/3 Running 0 16d
同时也会创建一个 Service,可以通过该 Service 访问 Blackbox Exporter 并传递一些参数:
[root@k8s-master01 ~]#kubectl get svc -n monitoring -l app.kubernetes.io/name=blackbox-exporter
NAME TYPE CLUSTER-IP EXTERNAL-IP PORT(S) AGE
blackbox-exporter ClusterIP 10.96.198.150 <none> 9115/TCP,19115/TCP 16d
比如检测下 gaoxin.kubeasy.com(使用任何一个公网域名或者公司内的域名探测即可)网站的状态,可以通过如下命令进行检查: