当前位置: 首页 > article >正文

skywalking各项指标说明

全局指标

  • all_p99:所有服务响应时间的第99百分位数(p99),即99%的请求响应时间都小于这个值。
  • all_p95:所有服务响应时间的第95百分位数(p95),即95%的请求响应时间都小于这个值。
  • all_p90:所有服务响应时间的第90百分位数(p90),即90%的请求响应时间都小于这个值。
  • all_p75:所有服务响应时间的第75百分位数(p75),即75%的请求响应时间都小于这个值。
  • all_p70:所有服务响应时间的第70百分位数(p70),即70%的请求响应时间都小于这个值。
  • all_heatmap:所有服务响应时间的热点图,用于可视化不同时间段内的服务响应时间分布。

服务指标

  • service_resp_time:服务的平均响应时间,即所有请求的平均处理时间。
  • service_sla:服务的成功率,通常定义为成功请求数除以总请求数。
  • service_cpm:服务每分钟调用次数,即每分钟对服务的调用次数。
  • service_p99:服务响应时间的第99百分位数(p99)。
  • service_p95:服务响应时间的第95百分位数(p95)。
  • service_p90:服务响应时间的第90百分位数(p90)。
  • service_p75:服务响应时间的第75百分位数(p75)。
  • service_p50:服务响应时间的第50百分位数(p50),即中位数。

服务实例指标

  • service_instance_sla:服务实例的成功率。
  • service_instance_resp_time:服务实例的平均响应时间。
  • service_instance_cpm:服务实例每分钟调用次数。

端点指标

  • endpoint_cpm:端点每分钟调用次数。
  • endpoint_avg:端点平均响应时间。
  • endpoint_sla:端点成功率。
  • endpoint_p99:端点响应时间的第99百分位数(p99)。
  • endpoint_p95:端点响应时间的第95百分位数(p95)。
  • endpoint_p90:端点响应时间的第90百分位数(p90)。
  • endpoint_p75:端点响应时间的第75百分位数(p75)。
  • endpoint_p50:端点响应时间的第50百分位数(p50)。

JVM指标

  • instance_jvm_cpu:JVM实例的CPU使用率。
  • instance_jvm_memory_heap:JVM堆内存使用量。
  • instance_jvm_memory_noheap:JVM非堆内存使用量。
  • instance_jvm_memory_heap_max:JVM堆内存最大可用量。
  • instance_jvm_memory_noheap_max:JVM非堆内存最大可用量。
  • instance_jvm_young_gc_time:JVM年轻代垃圾回收时间。
  • instance_jvm_old_gc_time:JVM老年代垃圾回收时间。
  • instance_jvm_young_gc_count:JVM年轻代垃圾回收次数。
  • instance_jvm_old_gc_count:JVM老年代垃圾回收次数。

服务关系指标

  • service_relation_client_cpm:在客户端每分钟检测到的调用次数。
  • service_relation_server_cpm:在服务端每分钟检测到的调用次数。
  • service_relation_client_call_sla:在客户端检测到的成功率。
  • service_relation_server_call_sla:在服务端检测到的成功率。
  • service_relation_client_resp_time:在客户端检测到的平均响应时间。
  • service_relation_server_resp_time:在服务端检测到的平均响应时间。

端点关系指标

  • endpoint_relation_cpm:端点关系每分钟调用次数。
  • endpoint_relation_resp_time:端点关系的平均响应时间。

其他关键指标

CPM:每分钟请求调用的次数

SLA:网站服务可用性(主要是通过请求成功与失败次数来计算),9越多代表全年服务可用时间越长服务更可靠,停机时间越短
1年 = 365天 = 8760小时
99.9 = 8760 * 0.1% = 8760 * 0.001 = 8.76小时
99.99 = 8760 * 0.0001 = 0.876小时 = 0.876 * 60 = 52.6分钟
99.999 = 8760 * 0.00001 = 0.0876小时 = 0.0876 * 60 = 5.26分钟
从以上看来,全年停机5.26分钟才能做到99.999%,即5个9

CLR:(公共语言运行库)在运行期管理程序的执行:主要包含:内存管理、代码安全验证、代码执行、垃圾收集。CLR有一项服务称为GC(Garbage Collector,垃圾收集),它能为你自动管理内存。GC自动从内存中删除程序不再访问的对象,GC是程序员不再操心许多以前必须执行的任务,比如释放内存和检查内存泄漏。

百分位数:skywalking中有P50,P90,P95这种统计口径,就是百分位数的概念。


http://www.kler.cn/a/397922.html

相关文章:

  • Kafka新节点加入集群操作指南
  • docker启动训练容器教程
  • mybatis-plus: mapper-locations: “classpath*:/mapper/**/*.xml“配置!!!解释
  • 神经网络的正则化(一)
  • Python 打包教程:从零开始构建可分发的Python包
  • 【数据库取证】快速从服务器镜像文件中获取后台隐藏数据
  • Robot | 用 RDK 做一个小型机器人(更新中)
  • 222. 完全二叉树的节点个数【 力扣(LeetCode) 】
  • uniapp 跨域前端代理
  • FPGA 第8讲 简单组合逻辑--半加器
  • uni-app快速入门(三)--UniApp生命周期
  • java导出pdf
  • 后台管理系统(开箱即用)
  • 20241116下载中科创达的TurboX D660核心板的Android11的SDK的详细LOG
  • 前端第一天 鸿蒙实训第19天 前端篇
  • DAY29|贪心算法Part03|LeetCode:134. 加油站、135. 分发糖果、860.柠檬水找零、406.根据身高重建队列
  • 论文 | The Capacity for Moral Self-Correction in LargeLanguage Models
  • 蓝队基础2 -- 外部威胁与攻击面
  • 报错ImportError: Pandas requires version ‘3.0.7‘ or newer of ‘openpyxl‘
  • pom中无法下载下来的类外部引用只给一个jar的时候
  • ArkUI---常用组件---切换按钮 (Toggle)
  • 重置docker版本的octoprint管理员账号密码
  • ECharts 创建图表示例
  • 30 秒!用通义灵码画 SpaceX 星链发射流程图
  • Android 开启流量节省状态会使热点与网络共享无法打开
  • POI word转pdf乱码问题处理