当前位置: 首页 > article >正文

llamafactory微调

1.启动llamafactory可视化页面选择模型
docker部署完成后
bash 代码解读复制代码#运行此命令进入容器内部
docker exec -it llamafactory /bin/bash

启动可视化页面

llamafactory-cli webui

在这里插入图片描述
然后在本机访问localhost:7860
在这里插入图片描述
语言和需要的模型,在此选择后,模型路径会自动填充,启动训练时会自动向huggingface下载base模型,但由于国内原因,可能无法访问到huggingface,可以选择设置魔搭下载地址
set USE_MODELSCOPE_HUB=1
或者使用本地地址,这边是使用了本地地址 首先在魔搭社区选择需要的文件git 拉取到本地
第一次需要安装git-lfs
git lfs install
后选择需要的模型地址git clone即可
文件映射
由于我们使用的是docker部署的llamafactory,因此调用模型前,需要将本地的模型文件夹映射到docker镜像中,建议一并设置多个路径用以存放微调后的模型文件,命令行中输入多个映射对即可
bash 代码解读复制代码docker run -v <本地存放目录>:<容器目录> <镜像名称> <本地存放目录>:<容器目录> <镜像名称>

然后在模型路径中填写该文件在docker镜像的地址
继续选择参数

数据集设置
提示模板一定要选取,不同模型对应的模板也是不尽相同的,如果有自定义格式文件,可导入到镜像中,然后在data_info.json中进行注册,否则无法在列表选择

然后是比较关键的几个参数,对训练结果影响巨大

选择数据集后,学利率可以选择默认5e-5
bash 代码解读复制代码#学习率
#学习率越低,训练越准确,相应的时间会更长
#对于llama3.1-8b 选择低一点的学习率比较好

#轮数
#训练轮次

#最大样本数
#即为’训练时在提供的每个数据集最多提取多少个样子进行训练’
#数据集较多的情况下建议适当设置更小的参数

训练轮数(!!!)
轮数的设置
目前没有更好的办法,全凭经验对新手是不友好的,比较推荐的方案是设置一个相当大的轮数,在训练过程中关注loss曲线,当曲线越趋近于平滑,说明训练已经接近完成,此时应手动停止训练以避免过拟合

当然也支持命令行调用训练的方式

测试和导出
切换chat Tab

补全上次训练的检查点路径加载,即可发起对话,此时您可以初步判断训练效果了(留坑,后续更新ragas评估)
切换export Tab ,选择上次训练的检查点,填写导出目录(注意:需填写docker镜像内部目录),如果您目录已经映射本地,则可以在本地文件中查看到训练后的safetensors文件

llamafactory就到此完成,后续会更新借助llama.cpp的量化和ollama部署


http://www.kler.cn/a/416726.html

相关文章:

  • 摄像头原始数据读取——V4L2(userptr模式,V4L2_MEMORY_USERPTR)
  • Springboot项目集成Mybatis-Plus,多数据源配置,写主读从
  • 【人工智能】从零构建一个文本分类器:用Python和TF-IDF实现
  • 网络原理->DNS协议和NAT协议解
  • VMware ubuntu创建共享文件夹与Windows互传文件
  • Java面试题、八股文——JVM篇最终篇
  • 电子资料管理系统ImageUpload存在任意文件上传致RCE漏洞
  • 【Leetcode 每日一题 - 补卡】3235. 判断矩形的两个角落是否可达
  • PHP如何在MongoDB中使用正则表达式进行查询
  • GY302光照传感器模块详解
  • PotPlayer 最新版本支持使用 Whisper 自动识别语音生成字幕
  • Kafka AdminClient API 来获取特定 Kafka 消费组的消费延迟
  • 基于特征子空间的高维异常检测:一种高效且可解释的方法
  • ASP.net WebAPI 上传图片实例(保存显示随机文件名)
  • 时频转换 | Matlab基于垂直二阶同步压缩变换vertical second-order synchrosqueezing一维数据转二维图像方法
  • 微服务篇-微服务保护:使用 Sentinel 来实现请求限流、线程隔离、服务熔断和 Fallback 备用方案的使用
  • 终端环境下关闭显示器
  • 基于AutoEncode自编码器的端到端无线通信系统matlab误码率仿真
  • Keil Debug 添加变量监视
  • 【北京迅为】iTOP-4412全能版使用手册-第二十章 搭建和测试NFS服务器
  • Figma入门-自动布局
  • Springboot组合SpringSecurity安全插件基于密码的验证Demo
  • 目标检测,图像分割,超分辨率重建
  • 什么是Delta Lake(数据湖框架),以及Delta Lake特性和如何使用
  • 软路由设置ip地址实现一机一IP
  • JiaJia-CP-1,2,3的WP(2)