ubuntu24.04执行nvidia-smi报错,实际生产报错,处理过程
报错日志
root@h1-29:/var/nvidia-driver-local-repo-ubuntu2404-570.124.06# nvidia-smi Failed to initialize NVML: Driver/library version mismatch NVML library version: 570.124
解决 NVML 驱动/库版本不匹配
问题的分步指南
根据你的描述,当前系统已安装 570.124.06
版本的 NVIDIA 驱动,但 nvidia-smi
报错 NVML library version: 570.124
,表明驱动内核模块与用户态库版本不一致。以下是系统性排查与修复步骤:
1. 检查内核模块版本
驱动内核模块(nvidia.ko
)可能未正确更新或加载。
# 查看当前加载的内核模块版本
cat /proc/driver/nvidia/version
- 预期输出:应显示
570.124.06
。 - 若显示旧版本