当前位置: 首页 > article >正文

【解决】Linux更新系统内核后Nvidia-smi has failed...

问题概述

由于服务器(操作系统为 RedHat 9)宕机,重启后,系统内核自动更新了,然后输入 nvidia-smi 发现报了下面的异常:

NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running.

上述其实是由于系统更新后,Nvidia驱动中的系统内核头文件无法使用导致的。

重新启动计算机后,NVIDIA SMI会显示NVIDIA驱动程序丢失,这是由于Linux内核升级,以前的NVIDIA驱动程序与连接不匹配。

解决方法

【这里主要针对系统中仍然还存在 nvidia 驱动来操作】

1 检查Nvidia是否在操作系统

命令行输入 nvcc -V

出现下面的情况 说明系统中的 Nvidia-smi 驱动未损坏 或者卸载。

2 安装kms 

 DKMS(Dynamic Kernel Module System)可以在内核变化后自动编译模块,并适应新的内核。它允许离散内核模块更新,而无需修改整个内核。使用 dkms 重新安装内核的相应驱动程序:

Red Hat系统中安装DKMS的命令:

sudo yum install epel-release
sudo yum install dkms

 

3 检查Nvidia驱动版本

ls /usr/src | grep nvidia

4 使用kms更新驱动

dkms install -m nvidia -v 535.171.04

 

 

5 重新输入 nvidia-smi,验证成功

 

  【如果上述过程不行,可尝试重新安装驱动。】 

 

 


http://www.kler.cn/a/449039.html

相关文章:

  • Android基于Path的addRoundRect,Canvas剪切clipPath简洁的圆角矩形实现,Kotlin(1)
  • XMLHttpRequest的基础知识
  • PostgreSQL 的历史
  • GUI07-学工具栏,懂MVC
  • 前端开放性技术面试—面试题
  • Pytorch | 利用NI-FGSM针对CIFAR10上的ResNet分类器进行对抗攻击
  • vscode Ctrl D 复制到下一行 快捷键
  • 【机器学习】机器学习的基本分类-强化学习-模型预测控制(MPC:Model Predictive Control)
  • Springboot高并发乐观锁
  • Maven的概念
  • 【数理统计】假设检验
  • 【尚硅谷 - SSM+SpringBoot+SpringSecurity框架整合项目 】项目打包并且本地部署
  • devops和ICCID简介
  • ‌QPainter在Qt中三种类型的渐变
  • AOP中动态代理详解
  • 因子分解(递归)
  • Farfalle - 开源的AI搜索引擎
  • 基于微信小程序的在线选课系统springboot+论文源码调试讲解
  • 5G学习笔记之Non-Public Network
  • SQL Server 批量插入数据的方式汇总及优缺点分析
  • 从零开始C++棋牌游戏开发之第四篇:牌桌界面与交互实现
  • GKE中使用Google Cloud Monitoring监控和Stackdriver Logging查看日志
  • postgreSql对分钟级的降雨数据进行插值为整小时
  • 4 软件工程——总体设计
  • 【Android】Android生成二维码并动态刷新
  • 架构师之路--达梦数据库学习计划