当前位置: 首页 > article >正文

【#第三期实战营闯关作业##LMDeploy 量化部署进阶实践 】

今天学习了《LMDeploy 量化部署进阶实践》一课,,收获很大。以下是记录复现过程及截图:在这里插入图片描述
创建一个名为lmdeploy的conda环境
在这里插入图片描述
创建成功后激活环境并安装0.5.3版本的lmdeploy及相关包。在这里插入图片描述

相关包install成功在这里插入图片描述
创建好的conda环境并启动InternLM2_5-7b-chat。这是对话截图
运行InternLM2.5 -20B模型,会发现此时显存占用大约71G:单卡80G-220=40G,400.8=32G,so,(权重)2*20G+32G(cache占用)=72G.
在这里插入图片描述
启动API服务器。后端logo在这里插入图片描述
api的ui
在这里插入图片描述
以Gradio网页形式连接API服务器,输入http://127.0.0.1:6006,然后就可以与模型尽情对话了,就是上面截图。


http://www.kler.cn/a/291797.html

相关文章:

  • 【人工智能】用Python实现图卷积网络(GCN):从理论到节点分类实战
  • Spring Boot--06--整合Swagger
  • 电子应用设计方案-63:智能升降茶几系统方案设计
  • 【C语言】特殊指针汇总
  • 《剑网三》遇到找不到d3dx9_42.dll的问题要怎么解决?缺失d3dx9_42.dll是什么原因?
  • python学opencv|读取图像(十七)认识alpha通道
  • MySQL 字符串操作详解和案例示范
  • vue ts as断言处理
  • 自定义 ConsoleAppender 实现日志预处理
  • tcp如何保证可靠性传输
  • 数据资产入表元年,企业如何抓住数据资产增值的机遇?
  • 核心交换机的六个基础知识
  • 智慧体育馆如何区别于传统场馆?
  • 选择高性能服务器租用的优势有哪些?
  • vulhub xxe靶机通关教程
  • 编译FFmpeg动态库
  • 深入Redis:事务的理解
  • 【机器学习-神经网络】卷积神经网络
  • antv x6 的画布大小设置
  • HBase 源码阅读(一)
  • day01-项目概述、环境搭建
  • 【非零段划分 / 2】
  • MySQL——事务与存储过程(三)存储过程的使用(2) 查看存储过程
  • vs2022 的wpf应用,需要生成的WpfApp1\bin\Debug\WpfApp1.exe添加图
  • 等保测评中的访问控制与用户认证
  • WS2812B驱动