【LLM】o1/R1系列LLM数据篇
关于思维链推理的10开源数据集:
目前开源的数据主要有如下:
1、Magpie-Reasoning-V2数据集,其中包含DeepSeek-R1生成的250K思路链推理样本,这些示例涵盖了数学推理、编码和一般问题解决等各种任务。https://huggingface.co/datasets/Magpie-Align/Magpie-Reasoning-V2-250K-CoT-Deepseek-R1-Llama-70B
2、Dolphin-R1,包含80万个样本的数据集,其中的数据来自DeepSeek-R1和Geminiflash的生成结果,同时还有来自Dolphinchat的20万个样本。https://huggingface.co/datasets/cognitivecomputations/dolphin-r1,https://modelscope.cn/datasets/AI-ModelScope/dolphin-r1
3、R1-Distill-SFT,有17000个样本,目的是创建数据以支持Open-R1项目,https://huggingface.co/datasets/ServiceNow-AI/,https://modelscope.cn/datasets/ServiceNow-AI/R1-Distill-SFT
4、NuminaMath-TIR,工具类数据集。 https://www.modelscope.cn/datasets/AI-MO/NuminaMath-TIR,
5、NuminaMath-CoT,大约86万道数学题,每个解题过程都以“思维链”方式呈现。 https://www.modelscope.cn/datasets/AI-MO/NuminaMath-CoT
6、BAAI-TACO,代码生成的基准,包含26443个问题。 https://modelscope.cn/datasets/BAAI/TACO
7、OpenThoughts-114k,开放的合成推理数据集,包含11.4万个高质量样本,涵盖数学、科学、代码和谜题等领域。 https://modelscope.cn/datasets/open-thoughts/OpenThoughts-114k
8、Bespoke-Stratos-17k,对伯克利Sky-T1数据的复制,使用DeepSeek-R1创建了一个包含问题、推理过程和答案的数据集。 https://modelscope.cn/datasets/bespokelabs/Bespoke-Stratos-17k
9、clevr_cogen_a_train,R1蒸馏视觉推理数据集。 https://huggingface.co/datasets/leonardPKU/clevr_cogen_a_train)-AR1-distilledvisualreasoningdataset.
10、S1k,训练S1模型的数据集,https://huggingface.co/datasets/simplescaling/s1K