当前位置: 首页 > article >正文

模型参数量与显存占用分析

常用模型参数量-显存占用估计统计如下表:

精度&显存模型占用量
32bit(FP32)-单精度16bit(FP16/BF16)-半精度8bit(int8)4bit(int4)
参数量
14byte2byte1byte0.5byte
1B4GB2GB1GB0.5GB
2B8GB4GB2GB1GB
7B28GB14GB7GB3.5GB
13B52GB26GB13GB6.5GB
32B128GB64GB32GB16GB
70B280GB140GB70GB35GB

训练显存

由于反向传播、Adam优化和Transformer架构等因素,保守估计,训练所需的显存是模型参数所占显存的4倍(1x 为模型 、1x 为梯度、1~2x 为优化器)。

注1:使用AdamW优化器,显存需求为2x;使用SGD优化器,显存需求为1x

为了确保训练期间模型收敛,参数类型一般不能是int8或int4。通常使用FP32或量化到BF16。

例如,使用单浮点精度FP32训练一个1B模型大约需要16GB(4GB x 4)。

  • 对于float32类型:1B(10亿参数)x 4(float的字节数)+ 1*4 + 2*4 = 4*4=16G
  • 对于half/BF16类型参数:1B(10亿参数)x 2(每个BF16参数字节数)x 4 = 8 GB

推理显存

训练所需的显存是模型参数所占显存的1倍(1x 为模型)。

例如,使用单浮点精度FP32训练一个1B模型大约需要4GB(4GB x 1)。

  • 对于float32类型:1B(10亿参数)x 4(float的字节数)=4G

 transformer系列5---transformer显存占用分析_transformer 占用显存大小-CSDN博客

https://cuiyuhao.com/posts/c87c0f5d/


http://www.kler.cn/a/562142.html

相关文章:

  • 陀螺匠·企业助手v1.8 产品介绍
  • 无人系统:未来技术的自动化与智能化应用
  • 格行物联网代理项目技术解析:三网切换与AI识别如何赋能轻资产创业?格行随身WiFi和视精灵代理靠谱吗?格行乡村万店计划可行性深度分析!低成本的小生意有哪些?
  • angular贪吃蛇
  • mysql 迁移到人大金仓数据库
  • MySQL 面试
  • Plumelog与ELK集成Springboot
  • 探索Grover算法的原理及其实际应用
  • C# Json序列化的常用几种方式
  • ros进阶——强化学习倒立摆的PG算法实现
  • 【Java项目】基于Spring Boot的教师人事档案管理系统
  • Dubbo RPC 原理
  • DeepSeek 助力 Vue 开发:打造丝滑的 复选框(Checkbox)
  • 什么是谷歌富媒体搜索
  • springboot博客系统详解与实现(后端实现)
  • DeepSeek点燃AI大模型战火:编程语言争霸,谁将问鼎“终极武器”王座?
  • axios几种请求类型的格式
  • 企业微信第三方应用开发025_企微通讯录组件使用04_vue中使用ww-open-data通讯录展示组件---企业微信开发027
  • 基于C++“简单且有效”的“数据库连接池”
  • 45.matlab产生正弦叠加信号