当前位置: 首页 > article >正文

chatGPT o1 重磅发布!像人类大脑一样思考和推理!

引入 OpenAI o1-preview

一种用于解决复杂问题的新系列推理模型,将于 9 月 12 日推出。
在这里插入图片描述

OpenAI开发了一系列新的 AI 模型,这些模型在回应之前会花更多的时间思考。它们可以推理复杂的任务,比之前的模型在科学、编码和数学领域解决更难的问题。

OpenAI在 ChatGPT 和API 中发布了这个系列的第一个模型。这是一个预览版,OpenAI预计会有定期更新和改进。随着此次发布,OpenAI还包括了对下一个更新版本的评估,该版本目前正在开发中。

工作原理

OpenAI训练这些模型在回答之前花更多时间思考问题,就像人类一样。通过训练,它们学会了优化思维过程,尝试不同的策略,并识别自己的错误。
在这里插入图片描述

在OpenAI的测试中,下一次模型更新在物理、化学和生物学的挑战性基准任务中表现得类似于博士生。
在这里插入图片描述
OpenAI还发现它在数学和编程方面表现出色。在国际数学奥林匹克(IMO)预选考试中,GPT-4o 仅正确解决了 13% 的问题,而推理模型得分为 83%。它们的编码能力在竞赛中得到了评估,并在 Codeforces 竞赛中达到了第 89 百分位。您可以在OpenAI的技术研究文章中信息。
在这里插入图片描述

作为一个早期模型,它还没有很多让 ChatGPT 实用的功能,比如浏览网络信息和上传文件和图像。在很多常见情况下,GPT-4o 在近期会更为有用。

但对于复杂推理任务来说,这是一项显著的进步,代表了 AI 能力的新水平。鉴于此,OpenAI将计数器重置为 1,并将这个系列命名为 OpenAI o1。

安全性

作为开发这些新模型的一部分,OpenAI提出了一种新的安全培训方法,该方法利用它们的推理能力,使它们遵守安全和对齐指南。通过在上下文中推理我们的安全规则,它可以更有效地应用这些规则。

OpenAI衡量安全性的一种方法是测试当用户试图绕过安全规则时,OpenAI的模型能多好地继续遵守这些安全规则(称为 “越狱”)。在OpenAI最难的越狱测试之一中,GPT-4o 的得分是 22(在 0-100 的范围内),而OpenAI的 o1-preview 模型得分为 84。您可以在系统卡片和OpenAI的研究文章中信息。

为了匹配这些模型的新能力,OpenAI加强了我们的安全工作、内部治理和与联邦政府的合作。这包括使用我们的准备框架进行严格的测试和评估、最好的红队测试和董事会级别的审查流程,包括安全与安保委员会的审查。

为了推进OpenAI对 AI 安全的承诺,OpenAI最近与美国和英国的 AI 安全研究所正式签署了协议。OpenAI已经开始操作这些协议,包括向这些研究所提供早期访问此模型的研究版本。这是OpenAI合作关系的重要第一步,帮助建立在模型公开发布前和发布后的研究、评估和测试流程。

适用对象

如果您正在解决科学、编码、数学及类似领域中的复杂问题,这些增强的推理能力可能特别有用。例如,o1 可以用于医疗研究人员对细胞测序数据进行注释、物理学家生成量子光学所需的复杂数学公式,以及各领域开发者构建和执行多步骤的工作流程。

OpenAI o1-mini

o1 系列在准确生成和调试复杂代码方面表现出色。为了为开发者提供更高效的解决方案,OpenAI还发布了 OpenAI o1-mini,这是一个速度更快、成本更低的推理模型,特别适用于编码。作为一个较小的模型,o1-mini 的成本比 o1-preview 便宜 80%,使其成为需要推理但不需要广泛世界知识的应用的一个强大、经济的模型。

如何使用 OpenAI o1

从今天开始,ChatGPT Plus 和团队用户将能够在 ChatGPT 中访问 o1 模型。o1-preview 和 o1-mini 都可以在模型选择器中手动选择,并且在启动时,o1-preview 的每周消息限制为 30 条,o1-mini 为 50 条。OpenAI正在努力提高这些限制,并使 ChatGPT 能够自动为给定的提示选择合适的模型。

一个新的 ChatGPT 下拉菜单图像,显示了在一个明亮的黄色和蓝色抽象背景上显示的新 “o1-preview” 模型选项。
从下周开始,ChatGPT Enterprise 和 Edu 用户将可以访问这两个模型。

符合 API 使用第五级资格的开发者今天可以在 API 中开始使用这两个模型进行原型设计,每分钟的限制为 20 次。OpenAI正在努力在进一步测试后提高这些限制。目前,这些模型的 API 不包括函数调用、流式传输、支持系统消息和其他功能。要开始使用,请查看 API 文档。

OpenAI还计划向所有 ChatGPT 免费用户开放 o1-mini 访问。

接下来是什么?

这是在 ChatGPT 和 API 中的这些推理模型的早期预览版。除了模型更新之外,OpenAI还预计将添加浏览、文件和图像上传等功能,使其对所有人更有用。
在这里插入图片描述
在这里插入图片描述

OpenAI还计划继续开发和发布 GPT 系列模型,除了新的 OpenAI o1 系列外。


http://www.kler.cn/news/302295.html

相关文章:

  • 快速入门和简单理解并发编程中的并发、并行、同步、异步,并且简单实现多进程和多线程
  • JS设计模式之代理模式:对象的“虚拟与现实”
  • 基于51单片机的灯盘检测(PCF8591+CD4051 )
  • mp3转文字要怎么处理?使用这4个工具就对了
  • C# 中的矢量化运算:提升性能的艺术
  • OpenHarmony鸿蒙开发( Beta5.0)智能窗帘应该开发实践案例
  • 算法刷题[比较两个字符串的最大公字符串(滑动窗口实现)]
  • 基于Boost库的搜索引擎开发实践
  • OpenFeign原理
  • docker-ce.repo源、kubernetes.repo源
  • 通过AI来创建一个_____html css网页制作成品 例子演示
  • 精准电商营销:基于京东商品详情API返回值的数据分析
  • 探索Python中的链式赋值、系列解包赋值与常量
  • Vue.js中computed的使用方法
  • Minio笔记-Centos搭建Minio
  • pgAdmin 4备份数据库失败,解决
  • 武汉墨家人俱乐部
  • 计算机毕业设计选题推荐-校园车辆管理系统-Java/Python项目实战(亮点:数据可视化分析、账号锁定)
  • 如何为 MongoDB 3.0.4 以下版本选择合适的 PyMongo 版本
  • 第10章 中断和动态时钟显示
  • 零基础5分钟上手亚马逊云科技-为网站服务器配置DNS域名
  • 基础的八股
  • Go语言现代Web开发03 关键字和包以及基本数据类型
  • word文档无损原样转pdf在windows平台使用python调用win32com使用pip安装pywin32
  • PHP精准投放高效转化微信代金券发券系统小程序源码
  • QuecPythonHeliosSDK 使用介绍
  • 借助ChatGPT撰写学术论文的10条规则
  • android studio 模拟器 loadlibrary failed with 126:找不到指定的模块
  • 数据处理与统计分析篇-day02-Linux进阶
  • jenkins 部署应用到多个环境