当前位置: 首页 > article >正文

覆盖数学/代码/科学/谜题,高质量推理数据集汇总,助力复现DeepSeek超强推理能力

近期,DeepSeek-R1 引发的推理模型热潮仍在持续走高——1 月 31 日,OpenAI 推出全新推理模型 o3-mini;2 月 18 日,xAI 推出 Grok 3,包含具备推理能力的 Grok-3 Reasoning Beta 和 Grok-3 mini Reasoning;2 月 25 日,Anthropic 推出首款混合推理模型 Claude 3.7 Sonnet。

诚然,在大模型日益同质化、竞争激烈的背景下,推理能力已经成为衡量其性能的重要指标,同时也是 AI 向 AGI 进阶的重要发展方向。而随着算法优化的天花板逐渐显现,加之模型参数正逐渐被压缩至极限,数据的质量成为了决定模型能否从单纯的「答案记忆」转向深度「逻辑推演」的关键因素之一。

推理数据集的构建,远非简单的题目堆砌。为了防止模型在训练过程中泄露信息,在测试时作弊,数据需严格隔离测试集与训练集,并引入动态更新机制,定期更新题型。而在应对数学证明、代码生成这类复杂任务时,构建数据集时还需精心设计多个逻辑链条,巧妙设置隐藏陷阱条件,尽可能模拟人类解题过程中的试错与思考过程,以此为模型提供更贴近真实应用场景的学习素材。

DeepSeek 在 AIME 数学竞赛中的优异表现正是一个鲜明的例证,其依赖的 OpenThoughts-114k 数据集,涵盖了一系列需要逐步推导、涉及多个逻辑链条的问题, 以严格的验证机制和巧妙编排的多步推理结构,保证了数据的准确性和可靠性的同时,让模型能够从中学习到更深层次的推理能力,而不是仅仅依赖于「记忆」来答题。

总而言之,DeepSeek 的成功,使整个行业对高质量推理数据集的关注度激增。接下来,HyperAI超神经为大家整理了目前热度较高的推理数据集,覆盖数学、代码、科学、谜题等多个领域。 对于期望切实提升大模型推理能力的从业者与研究者而言,这些数据集无疑是绝佳的起点。

点击查看更多开源数据集:

https://go.hyper.ai/CdPJZ

推理数据集汇总

1、OpenThoughts-114k 推理数据集

预估大小: 922.07 MB

下载地址: https://go.hyper.ai/O8QIz

该数据集由 Open Thoughts 于 2025 年发布,专注于数学、代码、科学和谜题等领域,包含 11.4 万个高质量样本。旨在训练小型推理模型,使其在数学和代码推理任务上超越现有的大型模型(如 DeepSeek-R1-Distill-Qwen-32B 和 DeepSeek-R1-Distill-Qwen-7B)。

2、Bespoke-Stratos-17k 推理任务数据集

预估大小: 125 MB

下载地址: https://go.hyper.ai/xBHnu

该数据集是一个专为推理任务设计的高质量数据集,包含问题、推理轨迹和答案,覆盖代码、数学和科学谜题等多个领域,旨在为训练高性能推理模型提供支持。数据集由 3 部分组成:

  • 编程数据:5 千条来自 APPs 和 TACO 的数据* 数学数据:1 万条来自 NuminaMATH 数据集的 AIME、MATH 和 Olympiads 子集

  • 科学与谜题数据:1 千条来自 STILL-2 的数据

3、Dolphin-R1 推理数据集

预估大小: 2.24 GB

下载地址: https://go.hyper.ai/e5Jpv

Dolphin-R1 推理数据集包含约 80 万个样本,数据来源包括 DeepSeek-R1、Gemini Flash 以及 Dolphin Chat 提供的 20 万个样本,旨在为训练类似 DeepSeek-R1 的推理模型提供高质量的样本。这些样本主要用于提升模型在推理任务中的表现,涵盖数学、逻辑、编码等复杂任务。

4、LIMO 数学推理基准数据集

预估大小: 4.22 MB

下载地址: https://go.hyper.ai/yvrI4

LIMO 数学推理基准数据集仅包含了 817 个高质量数学推理样本,旨在通过精心挑选高质量的训练样本,训练和评估大模型的数学推理能力,该数据集主要用于训练大模型的数学解题能力,提升其在数学考试、竞赛题目(如 AIME、MATH-500 等)上的表现。

5、NuminaMath-1.5 数学推理数据集

预估大小: 446.62 MB

下载地址: https://go.hyper.ai/Sifj4

NuminaMath-1.5 数学推理数据集适用于数学教育、竞赛问题领域,包含了大约 900k 个高质量的竞赛级别数学问题,每个问题的解决方案都采用链式思维 (CoT) 格式。这些问题来源于中国高中数学练习和美国及国际数学奥林匹克竞赛问题。

6、OpenR1-Math-220k 数学推理数据集

预估大小: 8.44 GB

下载地址: https://go.hyper.ai/w7B4v

OpenR1-Math-220k 是一个大规模的数学推理数据集,由 Open R1 团队于 2025 年发布,旨在填补 DeepSeek R1 合成数据的缺口。该数据集包含 22 万条高质量的数学问题及其推理轨迹,这些数据源自 80 万条由 DeepSeek R1 生成的推理轨迹。

7、Chinese DeepSeek R1 Distill data

预估大小: 376 MB

下载地址: https://go.hyper.ai/jgea5

该数据集为中文开源蒸馏满血 R1 的数据集,数据集中不仅包含 Math 数据,还包括大量的通用类型数据,总数量为 110K 。其中包括:

  • Math:36,987 个样本

  • Exam:2,440 个样本

  • STEM:12,000 个样本

  • General:58,573 个样本,包含弱智吧、逻辑推理、小红书、知乎、 Chat 等


以上就是 HyperAI超神经为大家汇总的推理数据集,如果你有想要收录 hyper.ai 官方网站的资源,也欢迎留言或投稿告诉我们哦!


http://www.kler.cn/a/565624.html

相关文章:

  • 智慧港口可视化:开启港口数字化转型的新篇章
  • 不同数据类型在数据库和编程语言之间的对应关系表
  • Wireshark Lua 插件教程
  • Tailwind CSS 4【实用教程】
  • Python PDF文件拆分-详解
  • React面试葵花宝典之二
  • 【博资考2】网安学院-北航网安基础部分(简洁版)
  • 【LeetCode347】前k个高频元素
  • CIDR转IP段:原理Java实现
  • SpringCloud Gateway 集成 Sentinel 详解 及实现动态监听Nacos规则配置实时更新流控规则
  • 自动化测试的价值重构:软件质量保障的效率革命与理性抉择
  • 实践教程:使用DeepSeek实现PDF转Word的高效方案
  • [Machine Learning] K-means算法
  • DeepSeek开源周Day5压轴登场:3FS与Smallpond,能否终结AI数据瓶颈之争?
  • 场景重建——Nerf场景重建
  • 【PCIe 总线及设备入门学习专栏 10.1 -- Linux PCIe 驱动框架 之 RK3399 Region1 访问】
  • Vue 3指令全解析:内置指令与自定义指令实战指南
  • Day76 补JWT
  • [c语言日寄] 指针学习情况自检题目
  • 智能指针c/c++