当前位置: 首页 > article >正文

使用 vllm 部署 MiniCPM-o 2.6

使用 vllm 部署MiniCPM-o 2.6

  • 1. 创建虚拟环境
  • 2. 克隆代码
  • 3. 从代码安装 vllm
  • 4. 安装 flash-attn
  • 5. 启动 MiniCPM-o 2.6
  • 6. 使用 chatbox 客户端访问并测试一下

1. 创建虚拟环境

conda create -n vllm_openbmb python=3.11 -y
conda activate vllm_openbmb 

2. 克隆代码

git clone https://github.com/OpenBMB/vllm.git
cd vllm
git checkout minicpmo

3. 从代码安装 vllm

VLLM_USE_PRECOMPILED=1 pip install --editable . 

4. 安装 flash-attn

pip install flash-attn --no-build-isolation

5. 启动 MiniCPM-o 2.6

CUDA_VISIBLE_DEVICES=3,1,0,2 \
VLLM_WORKER_MULTIPROC_METHOD=spawn \ 
vllm serve openbmb/MiniCPM-o-2_6 --trust-remote-code --served-model-name gpt-4 --gpu-memory-utilization 0.98 --tensor-parallel-size 4 --port 8000 --api-key sk-123456

6. 使用 chatbox 客户端访问并测试一下

在这里插入图片描述
在这里插入图片描述


参考资料:

  • https://github.com/OpenBMB/MiniCPM-o?tab=readme-ov-file#efficient-inference-with-llamacpp-ollama-vllm

http://www.kler.cn/a/514314.html

相关文章:

  • windows git bash 使用zsh 并集成 oh my zsh
  • Element使用表单重置如果不使用prop,重置无法生效
  • Mysql触发器(学习自用)
  • STM32之CubeMX图形化工具开发介绍(十七)
  • Numpy基础01(Jupyter基本用法/Ndarray创建与基本操作)
  • 【数据分享】1929-2024年全球站点的逐年平均气温数据(Shp\Excel\无需转发)
  • Logo语言的操作系统
  • PostIn安装教程
  • Windows电脑安装USB Redirector并实现内外网跨网USB共享通信访问
  • Python爬虫学习第一弹 —— 爬虫的基础知识 及 requests基础
  • 深入理解机器学习中的零样本、少样本与微调
  • 金融场景 PB 级大规模日志平台:中信银行信用卡中心从 Elasticsearch 到 Apache Doris 的先进实践
  • uniapp的插件开发发布指南
  • FPGA 开发工作需求明确:关键要点与实践方法
  • 软件方法论--课程笔记(整理中)
  • 微信小程序wxs实现UTC转北京时间
  • linux-FTP服务配置与应用
  • https 的 CA证书和电子签名
  • GoReplay 流量录制与回放
  • Flink的流处理和批处理
  • 题海拾贝:力扣 225.用队列实现栈
  • 【PCL】Segmentation 模块—— 欧几里得聚类提取(Euclidean Cluster Extraction)
  • Chapter 3-14. Detecting Congestion in Fibre Channel Fabrics
  • HTML 表单和输入标签详解
  • 【2024年CSDN平台总结:新生与成长之路】
  • 【elasticsearch】elasticsearch索引库操作