当前位置：首页 > article >正文

llamafactory报错：双卡4090GPU，训练qwen2.5:7B、14B时报错GPU显存不足（out of memory），轻松搞定~~~

article 2025/1/3 0:13:06

实际问题场景：

使用llamafactory进行微调qwen2.5 7B和14B的大模型时，会出现out of memory的报错。尝试使用降低batch_size（原本是2，现在降到1）的方式，可以让qwen2.5:7B跑起来，但时不时会不稳定，还是会报这个错误；微调14B的话，直接就报错了，根本跑起来。（显卡配置为两张23G的4090显卡，显存一共46G）目测lora微调显存的大小是模型本身大小的3倍以上，才能正常跑起来。

解决办法:

去qwen的官网找到下载ds_config_zero3.json这个文件
https://github.com/QwenLM/Qwen/blob/main/finetune/ds_config_zero3.json
将文件放在llamafactory目录下
编辑ds_config_zero3.json这个文件，将device改成cpu即可

"zero_optimization": {
        "stage": 3,
        "offload_optimizer": {
            "device": "cpu",
            "pin_memory": true
        },
        "offload_param": {
            "device": "cpu",
            "pin_memory": true
        },

注: 若不知道这个配置的代表什么含义的话，可以看这一篇deepspeed配置讲解

启动llamafactory-cli webui ，把参数设置好，然后预览下启动命令，复制出来
将命令复制出来，在llamafactory当前目录下直接粘贴，启动就大功告成了！！！
（据说更大的模型都可以训练，只是需要的时间很多，没办法，时间换空间是这样了）

启动后查看显卡使用情况，显卡直接拉满

命令：nvitop
如果没有这个命令，pip install nvitop ，就可以实时查看显卡使用情况了

起飞在这里插入图片描述

http://www.kler.cn/a/458776.html

相关文章：

虚拟机Centos下安装Mysql完整过程（图文详解）

手机实时提取SIM卡打电话的信令声音-双卡手机来电如何获取哪一个卡的来电

【YOLO算法改进】ALSS-YOLO：无人机热红外图像｜野生动物小目标检测

从0实现llama3

41.3 将重查询记录增量更新到consul和redis中

极品飞车6的游戏手柄设置

Android 学习小记1

plantuml 信号时序图

重装操作系统后 Oracle 11g 数据库数据还原

深入理解Android中的ImageReader与JNI交互

Android笔试面试题AI答之Android基础（6）

【深度学习基础之多尺度特征提取】多尺度图像增强（Multi-Scale Image Augmentation）是如何在深度学习网络中提取多尺度特征的？附代码

DAY176内网对抗-信息收集篇SPN扫描DC定位角色区域定性服务探针安全防护凭据获取

《C++设计模式》策略模式

应用层1——C/S、P2P、DNS域名系统

【Rust自学】5.2. struct使用例（加打印调试信息）

使用 Spring Boot 和 GraalVM 的原生镜像

Ubuntu 22.04 升级 24.04 问题记录

使用 OpenCV 在图像中添加文字

oscp备战系列-Kioptrix2014

Oracle Managed Files（OMF）

sqlite3 python 如何使用

文件上传绕过最新版安全狗

Android 屏幕适配autosize

springboot514基于SpringBoot的家电销售展示平台(论文+源码)_kaic

kkFileView集成springboot：使用自定义预览接口（非minio预览接口），发现无法预览资源