chatGPT o1 重磅发布!像人类大脑一样思考和推理!
引入 OpenAI o1-preview
一种用于解决复杂问题的新系列推理模型,将于 9 月 12 日推出。
OpenAI开发了一系列新的 AI 模型,这些模型在回应之前会花更多的时间思考。它们可以推理复杂的任务,比之前的模型在科学、编码和数学领域解决更难的问题。
OpenAI在 ChatGPT 和API 中发布了这个系列的第一个模型。这是一个预览版,OpenAI预计会有定期更新和改进。随着此次发布,OpenAI还包括了对下一个更新版本的评估,该版本目前正在开发中。
工作原理
OpenAI训练这些模型在回答之前花更多时间思考问题,就像人类一样。通过训练,它们学会了优化思维过程,尝试不同的策略,并识别自己的错误。
在OpenAI的测试中,下一次模型更新在物理、化学和生物学的挑战性基准任务中表现得类似于博士生。
OpenAI还发现它在数学和编程方面表现出色。在国际数学奥林匹克(IMO)预选考试中,GPT-4o 仅正确解决了 13% 的问题,而推理模型得分为 83%。它们的编码能力在竞赛中得到了评估,并在 Codeforces 竞赛中达到了第 89 百分位。您可以在OpenAI的技术研究文章中信息。
作为一个早期模型,它还没有很多让 ChatGPT 实用的功能,比如浏览网络信息和上传文件和图像。在很多常见情况下,GPT-4o 在近期会更为有用。
但对于复杂推理任务来说,这是一项显著的进步,代表了 AI 能力的新水平。鉴于此,OpenAI将计数器重置为 1,并将这个系列命名为 OpenAI o1。
安全性
作为开发这些新模型的一部分,OpenAI提出了一种新的安全培训方法,该方法利用它们的推理能力,使它们遵守安全和对齐指南。通过在上下文中推理我们的安全规则,它可以更有效地应用这些规则。
OpenAI衡量安全性的一种方法是测试当用户试图绕过安全规则时,OpenAI的模型能多好地继续遵守这些安全规则(称为 “越狱”)。在OpenAI最难的越狱测试之一中,GPT-4o 的得分是 22(在 0-100 的范围内),而OpenAI的 o1-preview 模型得分为 84。您可以在系统卡片和OpenAI的研究文章中信息。
为了匹配这些模型的新能力,OpenAI加强了我们的安全工作、内部治理和与联邦政府的合作。这包括使用我们的准备框架进行严格的测试和评估、最好的红队测试和董事会级别的审查流程,包括安全与安保委员会的审查。
为了推进OpenAI对 AI 安全的承诺,OpenAI最近与美国和英国的 AI 安全研究所正式签署了协议。OpenAI已经开始操作这些协议,包括向这些研究所提供早期访问此模型的研究版本。这是OpenAI合作关系的重要第一步,帮助建立在模型公开发布前和发布后的研究、评估和测试流程。
适用对象
如果您正在解决科学、编码、数学及类似领域中的复杂问题,这些增强的推理能力可能特别有用。例如,o1 可以用于医疗研究人员对细胞测序数据进行注释、物理学家生成量子光学所需的复杂数学公式,以及各领域开发者构建和执行多步骤的工作流程。
OpenAI o1-mini
o1 系列在准确生成和调试复杂代码方面表现出色。为了为开发者提供更高效的解决方案,OpenAI还发布了 OpenAI o1-mini,这是一个速度更快、成本更低的推理模型,特别适用于编码。作为一个较小的模型,o1-mini 的成本比 o1-preview 便宜 80%,使其成为需要推理但不需要广泛世界知识的应用的一个强大、经济的模型。
如何使用 OpenAI o1
从今天开始,ChatGPT Plus 和团队用户将能够在 ChatGPT 中访问 o1 模型。o1-preview 和 o1-mini 都可以在模型选择器中手动选择,并且在启动时,o1-preview 的每周消息限制为 30 条,o1-mini 为 50 条。OpenAI正在努力提高这些限制,并使 ChatGPT 能够自动为给定的提示选择合适的模型。
一个新的 ChatGPT 下拉菜单图像,显示了在一个明亮的黄色和蓝色抽象背景上显示的新 “o1-preview” 模型选项。
从下周开始,ChatGPT Enterprise 和 Edu 用户将可以访问这两个模型。
符合 API 使用第五级资格的开发者今天可以在 API 中开始使用这两个模型进行原型设计,每分钟的限制为 20 次。OpenAI正在努力在进一步测试后提高这些限制。目前,这些模型的 API 不包括函数调用、流式传输、支持系统消息和其他功能。要开始使用,请查看 API 文档。
OpenAI还计划向所有 ChatGPT 免费用户开放 o1-mini 访问。
接下来是什么?
这是在 ChatGPT 和 API 中的这些推理模型的早期预览版。除了模型更新之外,OpenAI还预计将添加浏览、文件和图像上传等功能,使其对所有人更有用。
OpenAI还计划继续开发和发布 GPT 系列模型,除了新的 OpenAI o1 系列外。