当前位置: 首页 > article >正文

k8s DCGM GPU采集指标项说明

dcgm-exporter 采集指标项

指标解释
dcgm_fan_speed_percentGPU风扇转速占比(%)
dcgm_sm_clockGPU sm 时钟(MHz)
dcgm_memory_clockGPU 内存时钟(MHz)
dcgm_gpu_tempGPU 运行的温度(℃)
dcgm_power_usageGPU 的功率(w)
dcgm_pcie_tx_throughputGPU PCIeTX 传输的字节总数 (kb)
dcgm_pcie_rx_throughputGPU PCIeRX 接收的字节总数 (kb)
dcgm_pcie_replay_counterGPU PCIe重试的总数
dcgm_gpu_utilizationGPU 利用率(%)
dcgm_mem_copy_utilizationGPU 内存利用率(%)
dcgm_enc_utilizationGPU 编码器利用率(%)
dcgm_dec_utilizationGPU 解码器利用率(%)
dcgm_xid_errorsGPU 上一个xid错误的值
dcgm_power_violationGPU 功率限制导致的节流持续时间(us)
dcgm_thermal_violationGPU 热约束节流持续时间(us)
dcgm_sync_boost_violationGPU 同步增强限制,限制持续时间(us)
dcgm_fb_freeGPUfb(帧缓存)的剩余(MiB)
dcgm_fb_usedGPUfb(帧缓存)的使用(MiB)

http://www.kler.cn/news/17468.html

相关文章:

  • 操作系统之死锁处理策略
  • 体验 nanoGPT
  • PWLCM分段线性混沌映射
  • 日语学习(一)
  • flink-on-yarn两种提交模式及其区别
  • 【Linux问题合集001】Linux中如何将用户添加到sudo组中的步骤
  • 武忠祥老师每日一题||不定积分基础训练(六)
  • Lattics ——一款简单易用、好看强大的知识管理工具
  • 【Spring Security第一篇】初始Spring Security、表单认证、认证与授权
  • Docker安全最佳实践
  • 算法的时间复杂度和空间复杂度(友友们专属限定版)
  • linux常用操作
  • Java ---比较器
  • 武忠祥老师每日一题||定积分基础训练(五)
  • java基础:接口的定义与实现
  • 今日事务java所感
  • 深入源码理解redis数据结构(一)
  • 从 Elasticsearch 到 Apache Doris,10 倍性价比的新一代日志存储分析平台
  • IronOCR 2023.4.13 Crack
  • 【移动端网页布局】流式布局案例 ⑥ ( 多排按钮导航栏 | 设置浮动及宽度 | 设置图片样式 | 设置文本 )
  • JDK17新特性之--新的Compact Strings(JEP 254)
  • 以两分钟了解Python之SQLAlchemy框架的使用
  • 腾讯云的cdn怎么配置|腾讯云CDN配置教程
  • ps磨皮插件专用智能磨皮插件 AI算法美颜 提高P图效率
  • 如何在Emacs中设置字体大小?- 探索Emacs的设置字体大小方法
  • 微信小程序——自定义组件
  • 关于数据倾斜
  • 【Linux】基础IO——库函数与系统调用的关系
  • 牛客刷SQL题Day5
  • Golang中sync.Pool详解及使用方法