当前位置: 首页 > article >正文

微调这件小事:训练集中的输入数据该作为instruction还是input?从LLaMA-Factory的源码中寻找答案吧~

在之前的博文中,我们已经了解了LLaMA-Factory框架执行各类任务的流程。今天,我们将深入探讨SFT微调过程中关于数据集的两个关键问题:

  1. 数据集中的instruction和input是如何结合起来生成大模型可以理解的输入的?instruction是不是就是system prompt呢?(之所以会问这个问题,是因为我发现有的数据集将输入作为instruction,有的作为input,而它们在效果上基本没有区别)
  2. 模板(template)是如何起作用的?它如何将文本数据转换为模型可以理解的格式?

这两个问题其实在处理流程上是一体的,由于篇幅限制,我们这里先聚焦于第一个问题。

文章目录

    • SFT微调整体流程
      • 主要流程概括
      • 数据集与微调参数准备
      • SFT入参调试
    • 数据生成源码解析
      • 数据集准备
        • 数据集加载部分
          • 读取单个文件
          • 格式转换(解开谜题的钥匙)
          • 多数据集合并
        • 数据集后处理部分
    • 结论


🎉进入大模型应用与实战专栏 | 🚀查看更多专栏内容



http://www.kler.cn/a/598175.html

相关文章:

  • CSS3学习教程,从入门到精通,CSS3 布局语法知识点及案例代码(15)
  • HTML5 SVG 学习笔记
  • LeetCode 92 Reverse Linked List Ⅱ 反转链表Ⅱ
  • 中间件漏洞-WebLogic篇
  • llama源码学习·model.py[6]TransformerBlock类
  • uni-app 与webView 互相传值
  • 内网渗透技术 Docker逃逸技术(提权)研究 CSMSF
  • IDEA批量替换项目下所有文件中的特定内容
  • 监控易运维管理软件:轻松部署,高效运维
  • mysql中的游标是什么?作用是什么?
  • 地理编码/经纬度解析/经纬度地址转换接口如何用JAVA对接
  • 大模型在非小细胞肺癌预测及治疗方案制定中的应用研究报告
  • 算力100问☞第93问:算力资源为何更分散了?
  • 算法-分治
  • Linux内核,内存分布
  • 应用程序安全趋势:左移安全、人工智能和开源恶意软件
  • 游戏引擎学习第176天
  • 修改服务器windows远程桌面默认端口号
  • 2025.03.21首板涨停股票分析
  • 机器学习-聚类模型