当前位置: 首页 > article >正文

使用LLaMA-Factory微调时的数据集选择

LLamaFactory提供的默认数据集涵盖了自然语言处理领域中常见的多种任务,包括:

  • 指令跟随(Instruction Following): Alpaca, GLaIVE, LLaMA, MathInstruct, WebInstruct, AgentInstruct, Evol-Instruct 等。这些数据集主要用于训练模型遵循人类指令并生成文本。
  • 强化学习自人类反馈(RLHF): DPO, UltraFeedback, RLHF-V, VLFeedback, Orca Pairs, HH-RLHF, Nectar RM 等。这些数据集用于训练模型,使其生成的文本更符合人类偏好。
  • 知识密集型任务: WikiQA, WebQA, Cosmopedia, STEM-ZH, Ruozhiba GPT-4, FineWeb, FineWeb-Edu 等。这些数据集包含大量事实性知识,用于训练知识问答等任务。
  • 代码和文本: CodeAlpaca, The Stack, StarCoder Python 等。这些数据集包含代码和文本,用于训练代码生成等任务。
  • 通用文本: Alpaca-ZH, GLaIVE-ZH, UltraChat-ZH, Belle, OpenPlatypus, Firefly, Wikipedia-EN

http://www.kler.cn/a/416317.html

相关文章:

  • SRIO DRP动态速率配置说明(详细讲解)
  • 环形链表系列导学
  • Spring Boot开发——整合JPA配置多数据源
  • 华纳云:怎么通过宝塔面板访问php My Admin?
  • 群控系统服务端开发模式-应用开发-前端邮箱配置开发
  • txt地图格式处理
  • 搜索二维矩阵 II(java)
  • Maven Surefire 插件简介
  • 【Web开发基础学习——corsheaders 应用的理解】
  • Android Studio的AI工具插件使用介绍
  • 宠物之家:基于SpringBoot的领养平台
  • Windows搭建MaskRCNN环境
  • UML的相关介绍
  • 来聊一聊MySQL的Double write和Buffer Pool的关系
  • 论文笔记(五十八)Trends and challenges in robot manipulation
  • SSM搭建(1)——配置MyBatis
  • 第 36 章 - Go语言 服务网格
  • redis机制详解
  • 【Vue3】【Naive UI】<n-message>标签
  • Java—Properties类