当前位置: 首页 > article >正文

Ubuntu 24.04 安装 NVIDIA Container Toolkit 全指南:让Docker拥抱GPU

Ubuntu 24.04 安装 NVIDIA Container Toolkit 全指南:让Docker拥抱GPU

    • 前言
    • 一、环境准备
      • 1.1 验证驱动状态
    • 二、安装NVIDIA Container Toolkit
      • 2.1 添加官方仓库
      • 2.2 执行安装
    • 三、配置Docker运行时
      • 3.1 更新Docker配置
    • 四、验证安装结果
      • 4.1 运行测试容器
    • 五、实战应用

前言

在使用Docker运行需要GPU加速的AI应用时,可能会遇到报错:
docker: Error response from daemon: could not select device driver "" with capabilities: [[gpu]]
这是因为缺少 NVIDIA Container Toolkit —— 它是让容器访问宿主GPU的关键桥梁。
本文将以Ubuntu 24.04 (Noble Numbat)为例,手把手教你完成完整安装流程。


一、环境准备

1.1 验证驱动状态

nvidia-smi

成功时会显示类似以下输出(注意右上角的CUDA版本)


二、安装NVIDIA Container Toolkit

2.1 添加官方仓库

# 安装依赖
sudo apt-get update
sudo apt-get install -y curl

# 添加密钥和仓库
curl -fsSL https://nvidia.github.io/libnvidia-container/gpgkey | sudo gpg --dearmor -o /usr/share/keyrings/nvidia-container-toolkit-keyring.gpg
curl -s -L https://nvidia.github.io/libnvidia-container/stable/deb/nvidia-container-toolkit.list | \
  sed 's#deb https://#deb [signed-by=/usr/share/keyrings/nvidia-container-toolkit-keyring.gpg] https://#g' | \
  sudo tee /etc/apt/sources.list.d/nvidia-container-toolkit.list

2.2 执行安装

sudo apt-get update
sudo apt-get install -y nvidia-container-toolkit

三、配置Docker运行时

3.1 更新Docker配置

# 生成配置文件
sudo nvidia-ctk runtime configure --runtime=docker

# 重启Docker服务
sudo systemctl restart docker

四、验证安装结果

4.1 运行测试容器

docker run --rm --gpus all nvidia/cuda:12.6.0-base-ubuntu24.04 nvidia-smi

成功时会看到与宿主机相同的GPU信息输出。


五、实战应用

现在可以运行你的GPU容器应用了!例如:

docker run --gpus all -p 8880:8880 ghcr.io/remsky/kokoro-fastapi-gpu:latest

技术总结:本文介绍了在Ubuntu 24.04中配置GPU容器支持的全流程,涵盖了驱动安装、工具链配置和验证测试。如果您在操作中遇到问题,欢迎在评论区留言讨论!


http://www.kler.cn/a/521277.html

相关文章:

  • 代码随想录算法训练营第三十八天-动态规划-完全背包-322. 零钱兑换
  • MongoDB常见的运维工具总结介绍
  • vue中的el是指什么
  • Verilog中if语句和case语句综合出的电路区别
  • Linux常见问题解决方法--1
  • 【cran Archive R包的安装方式】
  • for...in 和 Object.keys().forEach的区别
  • GO语言 链表(单向链表
  • 接口管理文档Yapi的安装与配置
  • 华硕笔记本装win10哪个版本好用分析_华硕笔记本装win10专业版图文教程
  • 无所不搜,吾爱制造
  • 深入 Rollup:从入门到精通(一)专栏介绍
  • 【Leetcode 热题 100】139. 单词拆分
  • Autogen_core: Quickstart
  • vulnhub靶场【kioptrix-2】靶机
  • 如何使用tushare pro获取股票数据——附爬虫代码以及tushare积分获取方式
  • Excel分区间统计分析(等步长、不等步长、多维度)
  • 瑞芯微方案:RV1126定制开发板方案定制
  • 【Elasticsearch 基础入门】Centos7下Elasticsearch 7.x安装与配置(单机)
  • 论文阅读(十六):利用线性链条件随机场模型检测阵列比较基因组杂交数据的拷贝数变异
  • DataSecOps的要点
  • 【JavaWeb学习Day13】
  • 基于Python的网易云音乐分析可视化系统的设计与实现
  • 实现一个安全且高效的图片上传接口:使用ASP.NET Core和SHA256哈希
  • Qt中Widget及其子类的相对位置移动
  • SQL 指南