当前位置：首页 > article >正文

LLaMA-Factory微调实操记录

article 2025/4/2 20:55:22

1. LLaMA-Factory介绍

来源：国内开发，支持中文

简介：LLaMA Factory 是一个简单易用且高效的大型语言模型（Large Language Model）训练与微调平台。通过 LLaMA Factory，可以在无需编写任何代码的前提下，在本地完成上百种预训练模型的微调。

文档1：LLaMA-Factory文档1
文档2：LLaMA-Factory文档2

2.配置环境

安装步骤：

下载（上述文档有下载命令）：git clone --depth https://github.com/hiyouga/LLaMA-Factory.git
解压下载的llamafactory：unzip llamafactory.zip
先创建环境：conda create -n llamafactory python==3.10 -y
激活环境：source activate llamafactory
安装所需要的包：pip install -e .（一定要安装在创建的环境中哈,操作之前：cd LLaMa_factoty 的目录下）
启动（使用可视化，在llamafactory根目录下启动）：llamafactory-cli webui

启动之后的页面：
在这里插入图片描述

3. 使用LLaMA-Factory进行微调

下面我们来一一介绍如何设置页面上的参数：
在这里插入图片描述
语言：选择中文
模型名称：根据你要训练的模型名称进行搜索
模型路径：选择你下载好的模型的绝对路径
微调方法：这里我们选择lora微调
检查点路径：这里我们第一次微调，没有检查点，所以先不填

在这里插入图片描述
对话模版：这里会自动匹配
其他参数：先使用默认参数即可

在这里插入图片描述
这里我们先关注以下参数：

数据集：我们选择要用于训练的数据集，如果数据集找不到，那就是放错目录了；这里可以同时放多个数据集
训练轮次：尽量设置的大一点，在训练过程中，如果效果达到预期我们可以随时叫停
截断长度：根据你要训练的数据集的对话长度设置，我们这里对话较短，所以选的比较小
批次处理大小：根据显卡能力的大小进行调整，保证显卡计算力在90%即可
验证集比例：这里可以不用设置，因为GPT类型的大模型进行验证的意义不大

在这里插入图片描述
上述参数保持默认即可，或者根据你的情况先进行调整。

准备就绪，开始训练

这就表示已经开始训练了，那么等到什么时候就可以停止训练了呢？
一般来说，等到loss趋向收敛的时候就可以停止训练了，如下所示：
在这里插入图片描述
训练好的参数，保存在如下目录：

4. 测试微调后的模型

在测试之前，我们先得知道一个知识，就是：
我们这次微调采用的是lora微调，它是局部微调，所以微调得到的参数只是模型的一部分参数，我们不能单独使用上述图中的检查点进行测试，需要和原模型结合进行Chat 测试。具体操作如下：
在这里插入图片描述
加载模型之后，和他对话聊天，进行主观测评（我们可以先使用训练时用到的数据集中的数据进行测试）：