当前位置：首页 > article >正文

Docker lmdeploy 快速部署Qwen2.5模型openai接口

article 2025/2/21 3:36:16

启动服务

我已经把模型下载到/data/xiedong/Qwen2.5-72B-Instruct-GPTQ-Int4

所以docker直接启动：

docker run --runtime nvidia --gpus device=0 \
    -p 23333:23333 \
    --ipc=host -v /data/xiedong:/data/xiedong/ \
    openmmlab/lmdeploy:latest \
    lmdeploy serve api_server /data/xiedong/Qwen2.5-72B-Instruct-GPTQ-Int4

浏览器访问接口文档：http://101.136.8.66:23333

查看全文

http://www.kler.cn/a/387096.html

PHP静默活体识别API接口应用场景与集成方案

常用的c++新特性--＞day03

持续集成（Continuous Integration, CI）和持续部署（Continuous Deployment, CD）

C++高级编程（8）

unity3d————屏幕坐标，GUI坐标，世界坐标的基础注意点

PHP API的数据交互类型设计

短视频矩阵系统的源码， OEM贴牌源码

LSM树 (Log-Structured Merge Tree)、Cuckoo Hashing详细解读

ubuntu 22.04 server 安装和初始化 LTS

基于Springboot+Vue的心理咨询系统（含源码数据库）

Qt的C++中实现一个文本转语音（TTS）系统

XXL-TOOL v1.3.1 发布 | Java工具类库（Excel、Pipeline、Fiber…）

Kafka中如何做到数据唯一，即数据去重？

新手用docker真**难受

react 18 react-router-dom V6 路由传参的几种方式

前端实现json动画（附带示例）

unplugin-vue-components 库作用

MyBatis 返回 Map 或 List＜Map＞时，时间类型数据，默认为LocalDateTime，响应给前端默认含有‘T‘字符

【STM32F1】——舵机角度控制与TIM定时器

MySQL性能测试方案设计

启动服务

相关文章：