当前位置: 首页 > article >正文

k8s DCGM GPU采集指标项说明

dcgm-exporter 采集指标项

指标解释
dcgm_fan_speed_percentGPU风扇转速占比(%)
dcgm_sm_clockGPU sm 时钟(MHz)
dcgm_memory_clockGPU 内存时钟(MHz)
dcgm_gpu_tempGPU 运行的温度(℃)
dcgm_power_usageGPU 的功率(w)
dcgm_pcie_tx_throughputGPU PCIeTX 传输的字节总数 (kb)
dcgm_pcie_rx_throughputGPU PCIeRX 接收的字节总数 (kb)
dcgm_pcie_replay_counterGPU PCIe重试的总数
dcgm_gpu_utilizationGPU 利用率(%)
dcgm_mem_copy_utilizationGPU 内存利用率(%)
dcgm_enc_utilizationGPU 编码器利用率(%)
dcgm_dec_utilizationGPU 解码器利用率(%)
dcgm_xid_errorsGPU 上一个xid错误的值
dcgm_power_violationGPU 功率限制导致的节流持续时间(us)
dcgm_thermal_violationGPU 热约束节流持续时间(us)
dcgm_sync_boost_violationGPU 同步增强限制,限制持续时间(us)
dcgm_fb_freeGPUfb(帧缓存)的剩余(MiB)
dcgm_fb_usedGPUfb(帧缓存)的使用(MiB)

http://www.kler.cn/a/17468.html

相关文章:

  • 【机器学习】如何配置anaconda环境(无脑版)
  • SQL集合运算
  • C++ 并发专题 - 自旋锁的实现(Spinlock)
  • c++写一个死锁并且自己解锁
  • Spring Boot 2.x 和 Druid 多数据源整合 dm
  • 基于标签相关性的多标签学习
  • 操作系统之死锁处理策略
  • 体验 nanoGPT
  • PWLCM分段线性混沌映射
  • 日语学习(一)
  • flink-on-yarn两种提交模式及其区别
  • 【Linux问题合集001】Linux中如何将用户添加到sudo组中的步骤
  • 武忠祥老师每日一题||不定积分基础训练(六)
  • Lattics ——一款简单易用、好看强大的知识管理工具
  • 【Spring Security第一篇】初始Spring Security、表单认证、认证与授权
  • Docker安全最佳实践
  • 算法的时间复杂度和空间复杂度(友友们专属限定版)
  • linux常用操作
  • Java ---比较器
  • 武忠祥老师每日一题||定积分基础训练(五)
  • java基础:接口的定义与实现
  • 今日事务java所感
  • 深入源码理解redis数据结构(一)
  • 从 Elasticsearch 到 Apache Doris,10 倍性价比的新一代日志存储分析平台
  • IronOCR 2023.4.13 Crack
  • 【移动端网页布局】流式布局案例 ⑥ ( 多排按钮导航栏 | 设置浮动及宽度 | 设置图片样式 | 设置文本 )