当前位置: 首页 > article >正文

Docker安装GPUStack详细教程

目录

前置条件

 安装Nvidia Container Tooikit


 

前置条件

  • Docker
  • Nvidia Container Toolkit

 安装Nvidia Container Tooikit

1.安装必要的包

# 更新系统
sudo apt update && sudo apt upgrade -y

# 安装 CUDA 相关包
sudo apt-get install -y cuda-drivers nvidia-cuda-toolkit

# 安装 NVIDIA Container Toolkit
distribution=$(. /etc/os-release;echo $ID$VERSION_ID) \
      && curl -fsSL https://nvidia.github.io/libnvidia-container/gpgkey | sudo gpg --dearmor -o /usr/share/keyrings/nvidia-container-toolkit-keyring.gpg \
      && curl -s -L https://nvidia.github.io/libnvidia-container/$distribution/libnvidia-container.list | \
         sed 's#deb https://#deb [signed-by=/usr/share/keyrings/nvidia-container-toolkit-keyring.gpg] https://#g' | \
         sudo tee /etc/apt/sources.list.d/nvidia-container-toolkit.list

sudo apt-get update
sudo apt-get install -y nvidia-container-toolkit

2. 配置 NVIDIA Container Runtime:

sudo nvidia-ctk runtime configure --runtime=docker
sudo systemctl restart docker
  • 验证 NVIDIA 驱动在 WSL 中是否可用:
    nvidia-smi
  • 如果还是有问题,尝试在 Windows PowerShell(管理员)中:

    # 关闭 WSL

    wsl --shutdown

    # 重新启动 WSL

  • wsl

 

让我们尝试使用国内镜像源来解决网络问题:

  • 首先删除之前的配置:

    sudo rm -f /etc/apt/sources.list.d/docker.list

    sudo rm -f /etc/apt/keyrings/docker.gpg

  • 使用阿里云镜像:

    # 安装必要的包

    sudo apt update

    sudo apt install -y apt-transport-https ca-certificates curl gnupg lsb-release

    # 添加 Docker 的 GPG 密钥

    ve-keyring.gpg

    # 添加 Docker 仓curl -fsSL https://mirrors.aliyun.com/docker-ce/linux/ubuntu/gpg | sudo gpg --dearmor -o /usr/share/keyrings/docker-archi库

    echo \安装 containerd:

    sudo apt install -y containerd.io

      "deb [arch=$(dpkg --print-architecture) signed-by=/usr/share/keyrings/docker-archive-keyring.gpg] https://mirrors.aliyun.com/docker-ce/linux/ubuntu \

      $(lsb_release -cs) stable" | sudo tee /etc/apt/sources.list.d/docker.list > /dev/null

  • 更新包列表:

    sudo apt update

如果还是不行,我们可以尝试直接安装 Ubuntu 仓库中的版本:

# 安装 containerd

sudo apt install -y containerd

# 安装 runc

sudo apt install -y runc

然后启动gpustack

docker run -d \
--gpus all \
-p 9999:80 \
-p 10150:10150 \
-p 10151:10151 \
--name gpustack \
-v /mnt/d/gpustack/gpustack-data:/var/lib/gpustack \
-v /mnt/d/gpustack/model:/model \
--restart unless-stopped \
gpustack/gpustac

 

命令操作 

# 1. 首先进入容器

docker exec -it gpustack bash

# 2. 然后在容器内使用 gpustack 命令

gpustack model deploy \

  --name qwen2.5-0.5b \

  --model-path /model/qwen2.5-0.5b-instruct-fp16.gguf \

  --source local \

  --replicas 1

# 3. 查看模型列表

gpustack model list

# 4. 查看 worker 状态

gpustack worker list


http://www.kler.cn/a/457145.html

相关文章:

  • 解析 SQL 中的 NULL 与比较操作:NULL 值与任何值的比较会返回 UNKNOWN
  • 记录第一次跑YOLOV8做目标检测
  • LockSupport的源码实现原理(一)
  • 在实际开发中,如何权衡选择使用哪种数据结构和算法?
  • React基础知识学习
  • 【免费分享】mysql笔记,涵盖查询、缓存、存储过程、索引,优化。
  • 知识碎片-环境配置
  • 设计模式通俗解释
  • 基于springboot校园招聘系统源码和论文
  • c++---------------------------string
  • 深入解析JVM中对象的创建过程
  • 用 Python 从零开始创建神经网络(十八):模型对象(Model Object)
  • 隨筆20241226 ExcdlJs 將數據寫入excel
  • C# winform 报错:类型“System.Int32”的对象无法转换为类型“System.Int16”。
  • WPF编程excel表格操作
  • PDB数据库解析:
  • C 语言中 strlen 函数的深入剖析
  • leetcdoe 1670.设计前中后队列
  • opencv与pyqt6结合例子
  • 用VBA自动更正错误的注释引用序号
  • python圣诞节简单寻宝小游戏
  • Unity功能模块一对话系统(2)打字机淡入效果
  • 喜报 | 擎创科技入围上海市优秀信创解决方案
  • Rancher V2.9.0 Docker安装教程
  • 神经网络入门实战:(二十二)只训练 (多层网络的) 指定层 / (单层网络的) 指定参数
  • 青少年编程与数学 02-005 移动Web编程基础 06课题、响应式设计