当前位置：首页 > article >正文

【LLM】o1/R1系列LLM数据篇

article 2025/2/10 8:30:50

关于思维链推理的10开源数据集：
目前开源的数据主要有如下：

1、Magpie-Reasoning-V2数据集，其中包含DeepSeek-R1生成的250K思路链推理样本，这些示例涵盖了数学推理、编码和一般问题解决等各种任务。https://huggingface.co/datasets/Magpie-Align/Magpie-Reasoning-V2-250K-CoT-Deepseek-R1-Llama-70B

2、Dolphin-R1，包含80万个样本的数据集，其中的数据来自DeepSeek-R1和Geminiflash的生成结果，同时还有来自Dolphinchat的20万个样本。https://huggingface.co/datasets/cognitivecomputations/dolphin-r1，https://modelscope.cn/datasets/AI-ModelScope/dolphin-r1

3、R1-Distill-SFT，有17000个样本，目的是创建数据以支持Open-R1项目，https://huggingface.co/datasets/ServiceNow-AI/，https://modelscope.cn/datasets/ServiceNow-AI/R1-Distill-SFT

4、NuminaMath-TIR，工具类数据集。 https://www.modelscope.cn/datasets/AI-MO/NuminaMath-TIR，

5、NuminaMath-CoT，大约86万道数学题，每个解题过程都以“思维链”方式呈现。 https://www.modelscope.cn/datasets/AI-MO/NuminaMath-CoT

6、BAAI-TACO，代码生成的基准，包含26443个问题。 https://modelscope.cn/datasets/BAAI/TACO

7、OpenThoughts-114k，开放的合成推理数据集，包含11.4万个高质量样本，涵盖数学、科学、代码和谜题等领域。 https://modelscope.cn/datasets/open-thoughts/OpenThoughts-114k

8、Bespoke-Stratos-17k，对伯克利Sky-T1数据的复制，使用DeepSeek-R1创建了一个包含问题、推理过程和答案的数据集。 https://modelscope.cn/datasets/bespokelabs/Bespoke-Stratos-17k

9、clevr_cogen_a_train，R1蒸馏视觉推理数据集。 https://huggingface.co/datasets/leonardPKU/clevr_cogen_a_train)-AR1-distilledvisualreasoningdataset.

10、S1k，训练S1模型的数据集，https://huggingface.co/datasets/simplescaling/s1K

查看全文

http://www.kler.cn/a/539015.html