当前位置: 首页 > article >正文

llama-factory微调deepseek-r1:1.5b

1.下载llama-factory

llama-factory

git clone --depth 1 https://github.com/hiyouga/LLaMA-Factory.git
cd LLaMA-Factory
pip install -e ".[torch,metrics]"

查看版本

llamafactory-cli version

在这里插入图片描述

2.启动web ui

需要内网穿透工具:netapp

export USE_MODELSCOPE_HUB=1 && llamafactory-cli webui

在这里插入图片描述
进行端口映射:
在这里插入图片描述
映射完成后,打开 127.0.0.1:7860, 即可打开web端
在这里插入图片描述

3.测试

选择模型后,选择chat,加载模型
在这里插入图片描述
控制台下载模型
在这里插入图片描述
下载成功后,测试模型
在这里插入图片描述

4. 修改数据集

数据集存在 LLaMA-Factory\data 路径下

备份identity.json后,修改其中的变量,数据集变为如下
在这里插入图片描述

5.训练

选择配置参数后,在cmd中或者在web端都行
在这里插入图片描述
点开始后,cmd中输出正在训练

在这里插入图片描述
3 epochs 效果不好,改为30 epochs
在这里插入图片描述

6.测试

在chat中修改检查点,测试效果
在这里插入图片描述

7.导出模型

选择模型和检查点,填写路径,导出
在这里插入图片描述
导出结果
在这里插入图片描述


http://www.kler.cn/a/591883.html

相关文章:

  • HarmonyOS Next实战教程:实现中间凹陷的异形tabbar
  • MrRobot靶机详细解答
  • ubuntu安装milvus向量数据库
  • 玩转RAG应用:如何选对Embedding模型?
  • 结合使用 OpenCV 和 TensorFlow进行图像识别处理
  • Linux信号入门
  • DeepSeek:AI 搜索引擎的革新者?
  • 【数据分享】1999—2023年地级市固定资产投资和对外经济贸易数据(Shp/Excel格式)
  • 浅谈鸿蒙跨平台开发框架ArkUI-X
  • 再学:call与delegatecall、call转账 Bank合约
  • dockerfile 编写入门
  • 2025年渗透测试面试题总结- 腾讯科恩实验室实习 二面(题目+回答)
  • 采购与供应链项目建议书(46页PPT)(文末有下载方式)
  • 从bootloader跳到APP需要几步?
  • C# Exe + Web 自动化 (BitComet 绿灯 自动化配置、设置)
  • 如何创建并保存HTML文件?零基础入门教程
  • 深入理解 Vue 的响应式原理:从 Vue 2 到 Vue 3
  • Tailwind CSS 学习笔记(一)
  • LeetCode 第11题~第13题
  • Express.js 是一个轻量级、灵活且功能强大的 Node.js Web 应用框架