超越博士水平:OpenAI o1模型在科学和编程领域的卓越表现
OpenAI在2024年9月12日宣布了o1系列模型的发布,这标志着人工智能在复杂推理任务上的能力有了显著提升。o1系列包括两个版本:o1-preview和o1-mini。o1-preview模型在科学、编程和数学等领域的表现尤为突出,其推理能力几乎与博士生相当。在国际数学奥林匹克资格考试中,o1模型的正确率达到了83%,远超过GPT-4o的13%。同时,在Codeforces编程竞赛中,o1模型的表现也达到了第89百分位,展现了其在编码任务中的强大能力。
o1-mini模型则是一款更小、成本更低的版本,它在预训练期间针对STEM推理进行了优化,特别适合编程任务。o1-mini的成本比o1-preview低80%,但在STEM领域的推理能力几乎与o1-preview持平。o1-mini在高中AIME数学竞赛中的得分约为70.0%,接近o1的74.4%,而在Codeforces竞赛网站上的Elo得分为1650,与o1的1673接近,表现优于o1-preview的1258。
目前,o1-preview模型的使用限制为每周30条消息,而o1-mini则为每周50条消息。这一限制是为了管理计算资源并确保用户体验。OpenAI CEO Sam Altman表示,尽管o1模型仍然存在局限,但它的使用体验依然令人印象深刻。
智创聚合API平台已经支持了OpenAI的最新模型,并且没有使用限制。这意味着用户可以通过该平台充分利用o1系列模型的强大推理能力,而不必担心消息数量的限制。