【debug】nvidia-smi:Failed to initialize NVML: Unknown Error
今天用服务器时又突然报错cuda不可用,输入nvidia-smi检查,报错如题。
根据网上搜的原因,可能是因为系统内核自动升级导致与驱动版本不匹配,尝试重启:reboot,报错:
尝试 exit 退出容器再进入:无效
根据:如何修复 System has not been booted with systemd 报错信息?_system has not been booted with systemd as init sy-CSDN博客
表示系统尚未以systemd作为初始系统启动。 检查方法:ps -p 1 -o comm=
但是文中的解决方法不管用~
如果想确定自己所在的容器环境:
uname -a
检查系统信息
systemd-detect-virt
检查虚拟化信息。如果输出显示 none
,那么说明没有虚拟化。如果显示 kvm
、qemu
等字样,那么是在某种虚拟化环境中。
表示当前的环境是一个 基于 Ubuntu 的 Docker 容器。想重启 Docker 容器中,通常需要在宿主机上执行 Docker 命令,因为容器本身没有权限直接重启自己。只能联系宿主机那边给重启一下容器