当前位置: 首页 > article >正文

【LLM】o1/R1系列LLM数据篇

关于思维链推理的10开源数据集:
目前开源的数据主要有如下:

1、Magpie-Reasoning-V2数据集,其中包含DeepSeek-R1生成的250K思路链推理样本,这些示例涵盖了数学推理、编码和一般问题解决等各种任务。https://huggingface.co/datasets/Magpie-Align/Magpie-Reasoning-V2-250K-CoT-Deepseek-R1-Llama-70B

2、Dolphin-R1,包含80万个样本的数据集,其中的数据来自DeepSeek-R1和Geminiflash的生成结果,同时还有来自Dolphinchat的20万个样本。https://huggingface.co/datasets/cognitivecomputations/dolphin-r1,https://modelscope.cn/datasets/AI-ModelScope/dolphin-r1

3、R1-Distill-SFT,有17000个样本,目的是创建数据以支持Open-R1项目,https://huggingface.co/datasets/ServiceNow-AI/,https://modelscope.cn/datasets/ServiceNow-AI/R1-Distill-SFT

4、NuminaMath-TIR,工具类数据集。 https://www.modelscope.cn/datasets/AI-MO/NuminaMath-TIR,

5、NuminaMath-CoT,大约86万道数学题,每个解题过程都以“思维链”方式呈现。 https://www.modelscope.cn/datasets/AI-MO/NuminaMath-CoT

6、BAAI-TACO,代码生成的基准,包含26443个问题。 https://modelscope.cn/datasets/BAAI/TACO

7、OpenThoughts-114k,开放的合成推理数据集,包含11.4万个高质量样本,涵盖数学、科学、代码和谜题等领域。 https://modelscope.cn/datasets/open-thoughts/OpenThoughts-114k

8、Bespoke-Stratos-17k,对伯克利Sky-T1数据的复制,使用DeepSeek-R1创建了一个包含问题、推理过程和答案的数据集。 https://modelscope.cn/datasets/bespokelabs/Bespoke-Stratos-17k

9、clevr_cogen_a_train,R1蒸馏视觉推理数据集。 https://huggingface.co/datasets/leonardPKU/clevr_cogen_a_train)-AR1-distilledvisualreasoningdataset.

10、S1k,训练S1模型的数据集,https://huggingface.co/datasets/simplescaling/s1K


http://www.kler.cn/a/539015.html

相关文章:

  • 【Python】元组
  • 测试中的第一性原理:回归本质的质量思维革命
  • 借助AI,轻松读好书
  • swap内存
  • 理解UML中的四种关系:依赖、关联、泛化和实现
  • 【计组】实验五 J型指令设计实验
  • 【开学补课复习专题】python 语言考试试题2
  • cuda学习资料汇总
  • 第六届MathorCup高校数学建模挑战赛-A题:淡水养殖池塘水华发生及池水自净化研究
  • C++ 实现封装的顺序表:顺序表的操作与实践
  • 浏览器的缓存方式几种
  • 基于Java的在线购物系统的设计与实现
  • 【hive】记一次hiveserver内存溢出排查,线程池未正确关闭导致
  • C++ 中信号转异常机制:在磁盘 I/O 内存映射场景下的应用与解析
  • 49-拓展(1)
  • Docker 部署 verdaccio 搭建 npm 私服
  • Prompt逆向工程:如何“骗“大模型吐露其Prompt?
  • 从零开始人工智能Matlab案例-模拟退火算法
  • 0209作业
  • ollama部署教程
  • Logo语言的测试开发
  • Rust语言的安全开发
  • 硬核技术:小程序能够调用手机的哪些传感器
  • LeetCode热题100- 合并区间【JavaScript讲解】
  • Ubuntu如何开启VNC远程桌面连接
  • Vllm进行Qwen2-vl部署(包含单卡多卡部署及爬虫请求)