当前位置: 首页 > article >正文

ubuntu24安装xinference

一、单机部署 Xinference

  1. 拉取 Xinference 镜像
docker pull xprobe/xinference:latest

二、 启动容器(根据硬件选择命令)

仅 CPU 模式:
  docker run -d -p 9998:9998 --name xinference xprobe/xinference:latest
启用 GPU 加速(需 NVIDIA 驱动):
  docker run -d --gpus all -p 9998:9998 --name xinference xprobe/xinference:latest

三、如果报错could not select device driver ““ with capabilities: [[gpu]]
解决方法
既然通过–gpus参数调用宿主机GPU失败,那就重新安装一个英伟达的容器工具包
安装和配置NVIDIA Container Toolkit步骤:
NVIDIA容器工具包不能直接通过apt install命令安装,因此需要先执行如下命令添加英伟达的apt软件源

curl -fsSL https://nvidia.github.io/libnvidia-container/gpgkey | sudo gpg --dearmor -o /usr/share/keyrings/nvidia-container-toolkit-keyring.gpg \
  && curl -s -L https://nvidia.github.io/libnvidia-container/stable/deb/nvidia-container-toolkit.list | \
    sed 's#deb https://#deb [signed-by=/usr/share/keyrings/nvidia-container-toolkit-keyring.gpg] https://#g' | \

从存储库更新包列表:

sudo apt-get update

安装 NVIDIA Container Toolkit 软件包:

sudo apt-get install -y nvidia-container-toolkit

重启docker服务

sudo systemctl restart docker

四、启动服务

docker run -e XINFERENCE_MODEL_SRC=modelscope -p 9998:9997 --gpus all xprobe/xinference:latest xinference-local -H 0.0.0.0 --log-level debug

在这里插入图片描述


http://www.kler.cn/a/583393.html

相关文章:

  • blazemeter工具使用--用于自动生成jmeter脚本并进行性能测试
  • 【使用VGG进行迁移学习:超参数调节与优化技巧】
  • Matlab 双线性插值(二维)
  • 有没有开源的企业网盘,是否适合企业使用?
  • search搜索框功能完善
  • prompt大师高效提示词解析
  • spring boot和spring cloud的区别
  • 【网络安全 | 漏洞挖掘】四链路账户接管
  • Ubuntu22.04安装数据
  • [论文阅读]Trustworthiness in Retrieval-Augmented Generation Systems: A Survey
  • AI 学习笔记
  • 文件跨国传输如何加速?UDP改造机制解析
  • MySQL 全文搜索 (FULLTEXT) vs 合并字段模糊查询 (LIKE) 对比
  • 使用MySQL的Binlog来同步数据到ES当中
  • python爬虫碰到IP被封的情况,如何解决?
  • Netty基础—3.基础网络协议一
  • 养生,点亮健康生活
  • [密码学实战]Java实现国密TLSv1.3单向认证
  • hadoop 常用命令
  • 基于springboot vue实现的课程管理系统/教务管理