当前位置: 首页 > article >正文

试过了,多模态大模型Qwen/Qwen2.5-VL-3B-Instruct需要21G显存,我还是太天真啊!

前缘概述

之前说道,我想通过自己的笔记本(6G显存)部署一个Qwen/Qwen2.5-VL-3B-Instruct,最后因为显存不够,就放弃了。

Centos7,T4,几多磨难

但随后,我便开始了在一台系统为centos7,显卡为T4的机器上进行部署。总之就是很磨难,很多坑,最后还没有成功。

我猜测,相较于T4作为一张老显卡所带来的限制,centos7所默认的glibc版本为4.8应该是更为致命。

这一块儿,反正咱先给个初步的猜测,如果你想通过vllm部署Qwen/Qwen2.5-VL-3B-Instruct,如果你是centos7,那么请你优先采用docker部署。会省去很多麻烦。

如果你是T4这样的老显卡,也要做好被虐的准备。

柳暗花明,A100还是香啊

放弃T4之后,后来,到处乞讨,终于借到了一张A100。

就,怎么说呢?给我的感觉就是,贵的东西是真的香啊!

整个部署过程,除了安装uv,虚拟环境,和激活环境,后面,就两步:


http://www.kler.cn/a/572943.html

相关文章:

  • 【Azure 架构师学习笔记】- Azure Databricks (15) --Delta Lake 和Data Lake
  • Java8-Stream流介绍和使用案例
  • 腾讯云账号获取SecretId和SecretKey及混元模型调用
  • Dify 开源大语言模型应用开发平台使用(一)
  • 快速开始React开发(一)
  • 【练习】【二叉树】力扣热题100 543. 二叉树的直径
  • Sourcetrail 代码分析工具
  • 生产制造业务的核心--全面质量管理人机料法环
  • 基于Matlab/Simulink永磁直驱风电低电压穿越(LVRT)控制仿真模型
  • Unity3D 布料模拟(Cloth Simulation)详解
  • uniapp x 学习之 uts 语言快速入门
  • 《DeepSeek从部署到安全分析实战》
  • 学习日记-250305
  • 2024 年 6 月大学英语四级考试真题(第 2 套)——解析版
  • Vue3 Suspense 终极指南:原理、用法与替代方案
  • 【Linux】使用问题汇总
  • 聊天室Python脚本——ChatGPT,好用
  • 我们来学nginx -- 优化下游响应速度
  • centos搭建 Node.js 开发环境
  • 深入解析SpringMVC中Http响应的实现机制