当前位置：首页 > article >正文

chatGPT o1 重磅发布！像人类大脑一样思考和推理！

article 2025/2/26 18:49:40

引入 OpenAI o1-preview

一种用于解决复杂问题的新系列推理模型，将于 9 月 12 日推出。
在这里插入图片描述

OpenAI开发了一系列新的 AI 模型，这些模型在回应之前会花更多的时间思考。它们可以推理复杂的任务，比之前的模型在科学、编码和数学领域解决更难的问题。

OpenAI在 ChatGPT 和API 中发布了这个系列的第一个模型。这是一个预览版，OpenAI预计会有定期更新和改进。随着此次发布，OpenAI还包括了对下一个更新版本的评估，该版本目前正在开发中。

工作原理

OpenAI训练这些模型在回答之前花更多时间思考问题，就像人类一样。通过训练，它们学会了优化思维过程，尝试不同的策略，并识别自己的错误。
在这里插入图片描述

在OpenAI的测试中，下一次模型更新在物理、化学和生物学的挑战性基准任务中表现得类似于博士生。
在这里插入图片描述
OpenAI还发现它在数学和编程方面表现出色。在国际数学奥林匹克（IMO）预选考试中，GPT-4o 仅正确解决了 13% 的问题，而推理模型得分为 83%。它们的编码能力在竞赛中得到了评估，并在 Codeforces 竞赛中达到了第 89 百分位。您可以在OpenAI的技术研究文章中信息。
在这里插入图片描述

作为一个早期模型，它还没有很多让 ChatGPT 实用的功能，比如浏览网络信息和上传文件和图像。在很多常见情况下，GPT-4o 在近期会更为有用。

但对于复杂推理任务来说，这是一项显著的进步，代表了 AI 能力的新水平。鉴于此，OpenAI将计数器重置为 1，并将这个系列命名为 OpenAI o1。

安全性

作为开发这些新模型的一部分，OpenAI提出了一种新的安全培训方法，该方法利用它们的推理能力，使它们遵守安全和对齐指南。通过在上下文中推理我们的安全规则，它可以更有效地应用这些规则。

OpenAI衡量安全性的一种方法是测试当用户试图绕过安全规则时，OpenAI的模型能多好地继续遵守这些安全规则（称为 “越狱”）。在OpenAI最难的越狱测试之一中，GPT-4o 的得分是 22（在 0-100 的范围内），而OpenAI的 o1-preview 模型得分为 84。您可以在系统卡片和OpenAI的研究文章中信息。

为了匹配这些模型的新能力，OpenAI加强了我们的安全工作、内部治理和与联邦政府的合作。这包括使用我们的准备框架进行严格的测试和评估、最好的红队测试和董事会级别的审查流程，包括安全与安保委员会的审查。

为了推进OpenAI对 AI 安全的承诺，OpenAI最近与美国和英国的 AI 安全研究所正式签署了协议。OpenAI已经开始操作这些协议，包括向这些研究所提供早期访问此模型的研究版本。这是OpenAI合作关系的重要第一步，帮助建立在模型公开发布前和发布后的研究、评估和测试流程。

适用对象

如果您正在解决科学、编码、数学及类似领域中的复杂问题，这些增强的推理能力可能特别有用。例如，o1 可以用于医疗研究人员对细胞测序数据进行注释、物理学家生成量子光学所需的复杂数学公式，以及各领域开发者构建和执行多步骤的工作流程。

OpenAI o1-mini

o1 系列在准确生成和调试复杂代码方面表现出色。为了为开发者提供更高效的解决方案，OpenAI还发布了 OpenAI o1-mini，这是一个速度更快、成本更低的推理模型，特别适用于编码。作为一个较小的模型，o1-mini 的成本比 o1-preview 便宜 80%，使其成为需要推理但不需要广泛世界知识的应用的一个强大、经济的模型。

如何使用 OpenAI o1

从今天开始，ChatGPT Plus 和团队用户将能够在 ChatGPT 中访问 o1 模型。o1-preview 和 o1-mini 都可以在模型选择器中手动选择，并且在启动时，o1-preview 的每周消息限制为 30 条，o1-mini 为 50 条。OpenAI正在努力提高这些限制，并使 ChatGPT 能够自动为给定的提示选择合适的模型。

一个新的 ChatGPT 下拉菜单图像，显示了在一个明亮的黄色和蓝色抽象背景上显示的新 “o1-preview” 模型选项。
从下周开始，ChatGPT Enterprise 和 Edu 用户将可以访问这两个模型。

符合 API 使用第五级资格的开发者今天可以在 API 中开始使用这两个模型进行原型设计，每分钟的限制为 20 次。OpenAI正在努力在进一步测试后提高这些限制。目前，这些模型的 API 不包括函数调用、流式传输、支持系统消息和其他功能。要开始使用，请查看 API 文档。

OpenAI还计划向所有 ChatGPT 免费用户开放 o1-mini 访问。