当前位置: 首页 > article >正文

SkyWalking 告警功能

SkyWalking 告警功能是在 6.x 版本新增的,其核心由一组规则驱动,这些规则定义在config/alarm-settings.yml文件中。

告警规则

  • 告警规则:它们定义了应该如何触发度量警报,应该考虑什么条件。
  • Webhook(网络钩子):定义当警告触发时,哪些服务终端需要被告知。

常用告警规则

SkyWalking 的发行版都会默认提供config/alarm-settings.yml文件,里面预先定义了一些常用的告警规则。如下:

  • 过去 3 分钟内服务平均响应时间超过 1 秒。
  • 过去 2 分钟服务成功率低于80%。
  • 过去 3 分钟内服务响应时间超过 1s 的百分比
  • 服务实例在过去 2 分钟内平均响应时间超过 1s,并且实例名称与正则表达式匹配。
  • 过去 2 分钟内端点平均响应时间超过 1 秒。
  • 过去 2 分钟内数据库访问平均响应时间超过 1 秒。
  • 过去 2 分钟内端点关系平均响应时间超过 1 秒。

这些预定义的告警规则,打开config/alarm-settings.yml文件即可看到

告警规则配置项的说明

  • Rule name:规则名称,也是在告警信息中显示的唯一名称。必须以_rule结尾,前缀可自定义
  • Include names:该规则作用于哪些实体名称,比如服务名,终端名(可选,默认为全部)
  • Exclude names:该规则作不用于哪些实体名称,比如服务名,终端名(可选,默认为空)
  • Threshold:阈值
  • OP: 操作符,目前支持 >、
  • Period:多久告警规则需要被核实一下。这是一个时间窗口,与后端部署环境时间相匹配
  • Count:在一个Period窗口中,如果values超过Threshold值(按op),达到Count值,需要发送警报
  • Silence period:在时间N中触发报警后,在TN -> TN + period这个阶段不告警。 默认情况下,它和Period一样,这意味着相同的告警(在同一个Metrics name拥有相同的Id)在同一个Period内只会触发一

http://www.kler.cn/news/339784.html

相关文章:

  • 开源2+1链动模式AI智能名片小程序在短视频创业中的应用与机遇
  • AI 正在颠覆编程,程序员的出路在哪里?
  • 【机器学习】线性回归算法简介 及 数学实现方法
  • The legacy JS API is deprecated and will be removed in Dart Sass 2.0
  • 股指期货和股指期权有什么区别?
  • 前端数据加载慢的解决方法
  • 案例-任务清单
  • PHP反射
  • LeetCode 48 Rotate Image 解题思路和python代码
  • Java第二阶段---12继承---第一节 继承
  • OpenAI 推出 Canvas 工具,助力用户与 ChatGPT 协作写作和编程
  • 和鲸科技创始人范向伟:拐点即将来临,AI产业当前的三个瓶颈
  • 十款超好用的图纸加密软件推荐!2024企业图纸加密最佳选择!
  • Python绘制--绘制心形曲线
  • 分布式事务讲解 - 2PC、3PC、TCC
  • C#来执行SolidWorks的VBA宏代码:来自粉丝的答疑贴
  • 解决Element-ui input 在搜狗输入法下,限制输入数字时先输入汉字后无法绑定的问题
  • 数据结构 ——— 单链表oj题:环状链表(求出环的入口节点)
  • Spring与Spring Boot之间的区别
  • HTML 什么是块级元素?