当前位置: 首页 > article >正文

大语言模型微调的公开JSON数据

大语言模型微调的公开JSON数据

在这里插入图片描述

以下是一些可用于大语言模型微调的公开JSON数据及地址:

  • EmoLLM数据集
    • 介绍:EmoLLM是一系列能够支持理解用户、帮助用户心理健康辅导链路的心理健康大模型,其开源了数据集、微调方法、训练方法及脚本等。数据集按用处分为general和role-play两种类型,按格式分为qa和conversation两种类型。
    • 地址:https://github.com/SmartFlowAI/EmoLLM/tree/main/datasets
  • kigner/ruozhiba-llama3数据集
    • 介绍:又称弱智吧数据集,大小为601k,包含1500条指令与答复。
    • 地址:https://huggingface.co/datasets/kigner/ruozhiba-llama3

http://www.kler.cn/a/557605.html

相关文章:

  • 请说明C#中的List是如何扩容的?
  • 分布式事务-本地消息表学习与落地方案
  • 计算机毕业设计Hadoop+Spark+DeepSeek-R1大模型民宿推荐系统 hive民宿可视化 民宿爬虫 大数据毕业设计(源码+LW文档+PPT+讲解)
  • Go并发编程陷阱:Goroutine泄露及其高效避免策略
  • DeepSeek写贪吃蛇手机小游戏
  • Java+SpringBoot+Vue+数据可视化的美食餐饮连锁店管理系统
  • RabbitMQ 消息队列的工作模式
  • 基于VirtualBox虚拟机部署完全分布式Hadoop环境
  • TextGNN: Improving Text Encoder via Graph Neural Network in Sponsored Search
  • Pytorch框架03-网络的搭建(nn.Module/卷积层/池化层/非线性激活/线性层/CIFAR-10分类模型搭建)
  • 分页功能组件开发
  • 1688代采下单API接口使用指南:实现商品采集与自动化下单
  • 深度学习-5.卷积网络
  • npm、pnpm和yarn有什么区别
  • Matplotlib 高级图表绘制与交互式可视化(ipywidgets)
  • 【Windows系统node_modules删除失败(EPERM)问题解析与应对方案】
  • mysql之规则优化器RBO
  • 关于 Grok-3 大语言模型的研究
  • Web Worker终极优化指南:4秒卡顿→0延迟的实战蜕变
  • 【AcWing】动态规划-线性DP -选数异或