大语言模型微调的公开JSON数据
大语言模型微调的公开JSON数据
以下是一些可用于大语言模型微调的公开JSON数据及地址:
- EmoLLM数据集
- 介绍:EmoLLM是一系列能够支持理解用户、帮助用户心理健康辅导链路的心理健康大模型,其开源了数据集、微调方法、训练方法及脚本等。数据集按用处分为general和role-play两种类型,按格式分为qa和conversation两种类型。
- 地址:https://github.com/SmartFlowAI/EmoLLM/tree/main/datasets
- kigner/ruozhiba-llama3数据集
- 介绍:又称弱智吧数据集,大小为601k,包含1500条指令与答复。
- 地址:https://huggingface.co/datasets/kigner/ruozhiba-llama3