当前位置: 首页 > article >正文

ubuntu安装NVIDIA显卡驱动及CUDA环境

在安装CUDA之前,需要先安装适用于您的GPU的NVIDIA显卡驱动。

一、准备工作

  1. 更新系统包

    在开始之前,建议先更新系统的包列表和已安装的软件包:

    sudo apt-get update
    sudo apt-get upgrade -y
    
  2. 卸载旧的NVIDIA驱动(如果已安装)

    如果您之前安装过NVIDIA驱动,建议先将其卸载,以避免版本冲突:

    sudo apt-get purge nvidia-*
    sudo apt-get autoremove
    
  3. 禁用Nouveau驱动

    Nouveau 是开源的NVIDIA驱动,如果启用,可能会与官方驱动产生冲突。禁用Nouveau的方法如下:

    sudo bash -c "echo 'blacklist nouveau' >> /etc/modprobe.d/blacklist.conf"
    sudo bash -c "echo 'options nouveau modeset=0' >> /etc/modprobe.d/blacklist.conf"
    sudo update-initramfs -u
    sudo reboot
    

    重启后,Nouvaue驱动将被禁用。

二、安装NVIDIA显卡驱动

有多种方法可以在Ubuntu上安装NVIDIA驱动,以下介绍两种常用方法:通过Ubuntu官方仓库安装和使用NVIDIA官方驱动PPA。

方法1:通过Ubuntu官方仓库安装

  1. 添加图形驱动PPA(可选)

    为确保获取最新的驱动版本,可以添加官方的graphics-drivers PPA:

    sudo add-apt-repository ppa:graphics-drivers/ppa
    sudo apt-get update
    
  2. 查找适合您的GPU的驱动版本

    运行以下命令以查看推荐的驱动版本:

    ubuntu-drivers devices
    

    输出示例:

    == /sys/devices/pci0000:00/0000:00:02.0/0000:01:00.0 ==
    modalias : pci:v000010DEd00001E87sv000017AAsd00003919bc03sc00i00
    vendor   : NVIDIA Corporation
    model    : GP107M [GeForce GTX 1050 Ti Mobile]
    driver   : nvidia-driver-470 - third-party free
    driver   : nvidia-driver-465 - third-party free
    driver   : xserver-xorg-video-nouveau - distro free builtin
    

    通常,推荐使用ubuntu-drivers autoinstall命令自动安装适合的驱动。

  3. 自动安装推荐的驱动

    sudo ubuntu-drivers autoinstall
    

    或者,手动安装特定版本的驱动,例如安装nvidia-driver-525

    sudo apt-get install nvidia-driver-525
    
  4. 重启系统

    安装完成后,重启系统以使驱动生效:

    sudo reboot
    

方法2:通过NVIDIA官方驱动PPA安装

  1. 添加NVIDIA驱动PPA

    sudo add-apt-repository ppa:graphics-drivers/ppa
    sudo apt-get update
    
  2. 安装最新的驱动

    查找可用的驱动版本:

    apt search nvidia-driver
    

    假设您选择安装nvidia-driver-525

    sudo apt-get install nvidia-driver-525
    
  3. 重启系统

    sudo reboot
    

三、验证驱动安装

  1. 检查NVIDIA驱动是否正确安装

    使用nvidia-smi命令查看驱动信息:

    nvidia-smi
    

    预期输出应显示您的GPU信息和驱动版本,例如:

    +-----------------------------------------------------------------------------+
    | NVIDIA-SMI 525.60.11    Driver Version: 525.60.11    CUDA Version: 12.0     |
    |-------------------------------+----------------------+----------------------+
    | GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
    | Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
    |                               |                      |               MIG M. |
    |===============================+======================+======================|
    |   0  GeForce GTX 1050 Ti    Off  | 00000000:01:00.0  On |                  N/A |
    | 30%   50C    P8    N/A /  75W |    500MiB /  4096MiB |      5%      Default |
    +-------------------------------+----------------------+----------------------+
    
  2. 检查驱动模块

    确认驱动模块已加载:

    lsmod | grep nvidia
    

    应该能看到nvidia相关的模块信息。

四、解决常见问题

  • 黑屏或无法启动图形界面

    如果在安装驱动后遇到黑屏或无法启动图形界面的问题,可以尝试以下步骤:

    1. 切换到TTY终端(使用Ctrl + Alt + F3)。

    2. 停止显示管理器,例如对于gdm

      sudo systemctl stop gdm
      

      或者对于lightdm

      sudo systemctl stop lightdm
      
    3. 重新安装驱动或检查驱动配置。

    4. 重启系统:

      sudo reboot
      
  • 驱动版本与CUDA不兼容

    确保安装的NVIDIA驱动版本与您计划安装的CUDA版本兼容。可以参考NVIDIA官方CUDA兼容性表。

五、安装CUDA

在成功安装并验证NVIDIA显卡驱动后,您可以按照之前提供的步骤继续安装CUDA。如果需要进一步指导,请参考以下简要步骤:

  1. 下载CUDA安装包

    前往NVIDIA CUDA下载页面,选择适用于您的Ubuntu版本的CUDA安装包。

  2. 添加CUDA仓库并安装CUDA

    示例(以Ubuntu 20.04和CUDA 12.2为例):

    wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2004/x86_64/cuda-ubuntu2004.pin
    sudo mv cuda-ubuntu2004.pin /etc/apt/preferences.d/cuda-repository-pin-600
    
    wget https://developer.download.nvidia.com/compute/cuda/12.2.0/local_installers/cuda-repo-ubuntu2004-12-2-local_12.2.0-470.57.02-1_amd64.deb
    sudo dpkg -i cuda-repo-ubuntu2004-12-2-local_12.2.0-470.57.02-1_amd64.deb
    sudo cp /var/cuda-repo-ubuntu2004-12-2-local/cuda-*-keyring.gpg /usr/share/keyrings/
    sudo apt-get update
    sudo apt-get -y install cuda
    
  3. 配置环境变量

    echo 'export PATH=/usr/local/cuda/bin${PATH:+:${PATH}}' >> ~/.bashrc
    echo 'export LD_LIBRARY_PATH=/usr/local/cuda/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}' >> ~/.bashrc
    source ~/.bashrc
    
  4. 验证CUDA安装

    nvcc --version
    nvidia-smi
    

    编译并运行CUDA样例以确保安装成功:

    cuda-install-samples-12.2.sh ~
    cd ~/NVIDIA_CUDA-12.2_Samples/1_Utilities/deviceQuery
    make
    ./deviceQuery
    

    输出应显示Result = PASS

六、参考资料

  • NVIDIA 官方驱动下载
  • NVIDIA CUDA 官方安装指南
  • Ubuntu 官方文档
  • NVIDIA 驱动兼容性文档

http://www.kler.cn/a/590829.html

相关文章:

  • DICOM医学影像数据访问控制与身份验证技术应用的重要性及其实现方法详解
  • 【AI学习从零至壹】Pytorch神经⽹络
  • 文件管理系统
  • tf1.x和tf2.x在使用上的区别和联系是什么
  • 蓝桥杯练习day1:拆分数位-四位数字的最小和
  • [模拟实现]unique_ptr、shared_ptr智能指针--C++版本的代码实现
  • 【自学笔记】MongoDB基础知识点总览-持续更新
  • 一条SQL在mysql数据库中经历的过程
  • STM32——基本定时器
  • 相机光学(四十七)——相纸材质
  • 神经网络量化3-全连接层实现量化
  • 相机标定之DLT算法学习
  • 对话傅盛:AI时代的超级应用是什么?
  • 【Python】10、集合
  • 使用fastapi部署stable diffusion模型
  • 3D点云目标检测——KITTI数据集读取与处理
  • 完全托管的DeepSeek-R1模型正式登陆Amazon Bedrock:安全部署与使用指南
  • Java的继承:方法;属性?
  • 个人学习编程(3-18) leetcode刷题
  • 在云平台上用Claude 3.7 AI代理自动化电脑图形界面点击操作做表格