当前位置：首页 > article >正文

超越博士水平：OpenAI o1模型在科学和编程领域的卓越表现

article 2025/2/25 19:08:23

OpenAI在2024年9月12日宣布了o1系列模型的发布，这标志着人工智能在复杂推理任务上的能力有了显著提升。o1系列包括两个版本：o1-preview和o1-mini。o1-preview模型在科学、编程和数学等领域的表现尤为突出，其推理能力几乎与博士生相当。在国际数学奥林匹克资格考试中，o1模型的正确率达到了83%，远超过GPT-4o的13%。同时，在Codeforces编程竞赛中，o1模型的表现也达到了第89百分位，展现了其在编码任务中的强大能力。

o1-mini模型则是一款更小、成本更低的版本，它在预训练期间针对STEM推理进行了优化，特别适合编程任务。o1-mini的成本比o1-preview低80%，但在STEM领域的推理能力几乎与o1-preview持平。o1-mini在高中AIME数学竞赛中的得分约为70.0%，接近o1的74.4%，而在Codeforces竞赛网站上的Elo得分为1650，与o1的1673接近，表现优于o1-preview的1258。

目前，o1-preview模型的使用限制为每周30条消息，而o1-mini则为每周50条消息。这一限制是为了管理计算资源并确保用户体验。OpenAI CEO Sam Altman表示，尽管o1模型仍然存在局限，但它的使用体验依然令人印象深刻。