当前位置: 首页 > article >正文

OpenAI发布GPT-4.5:功能非常特殊,推理很贵

今天凌晨4点,OpenAI进行了在线技术直播,发布了最新模型GPT-4.5。

GPT-4.5与之前的模型相比,本次最大的亮点是加上了“情商”,这也是目前所有大模型最缺、最难的功能。

此外,GPT-4.5 在SimpleQA上的测试数据显示,超过OpenAI o1、OpenAI o3-mini并且幻觉非常低,是目前OpenAI最强大模型之一。

图片

OpenAI联合创始人兼首席执行官Sam Altman特意发文对GPT-4.5进行了详细解读。

对我来说,GPT-4.5是第一个让我感觉像是在和一个有思想的人对话的模型。有好几次,我都不禁靠在椅背上,惊讶于能从人工智能那里得到真正有用的建议。

坏消息:GPT-4.5是一个大型且成本高昂的模型。我们本真的很想同时向Plus和Pro用户推出,但我们的业务增长迅猛,GPU 已经不够用了。下周我们会增加数万个 GPU,到时候就会向 Plus 用户推出。(很快还会有数十万个 GPU 到位,我敢肯定,大家会把我们能配备的每一个 GPU 都充分利用起来。)

我们也不想这样,但要精准预测导致 GPU短缺的增长高峰实在太难了。

提前告知一下:这不是一个推理模型,也不会在基准测试中表现得特别突出。是一种不同类型的智能,有着我从未感受过的神奇之处。真的很期待大家去体验!

图片

看了Sam这段话估计大家心里都有一个共同想法吧,既然推理这么贵,需要那么多GPU,是时候让DeepSeek再次出手量化一下了吧~

这不网友直接就替咱说出来了,你们一直严重依赖大量的 GPU,而中国人在没有这么多 GPU 的情况下也取得了同样的成果。为什么不像中国人那样专注于效率呢?

作为一名交易员,我只是不希望当 Deepseek用十分之一的计算力推出比 GPT-4.5 更强大的产品时,交易市场再次陷入动荡。

图片

刚刚看了一下API价格,确实贵的离谱…

图片

这听起来像是一个在大量录制的人类之间电话通话内容上进行训练的模型。

图片

增加服务之后,API价格会下降吗?

图片

真是令人激动的时代!一个真正让人感觉像是在与有思想的人对话的模型,这是一个巨大的飞跃。GPU 短缺只是暂时的困难,重要的是你们创造出的神奇成果。期待能亲自体验 GPT-4.5!

图片

GPT-4.5情商

在以往的大模型中,虽然能够生成流畅的文本,但在处理情感相关的场景时,往往显得生硬、机械,甚至有时会给出不恰当的回应。

GPT-4.5通过一系列技术创新和训练方法为模型增加了“情商”功能,显著提升了其在情感识别、同理心表达以及情感引导等方面的能力,使其在与人类互动时能够展现出更加温暖、细腻且富有同理心的特质。

GPT-4.5能够通过用户的文字输入,敏锐地捕捉到其中的情感色彩,无论是喜悦、悲伤、愤怒还是焦虑。这种能力并非简单地基于关键词的匹配,而是通过深度学习和大量的对话数据训练而来。

模型学会了从语句的整体语境中理解情感的细微差别,从而能够更准确地判断用户的情绪状态。例如,当用户表达“我最近考试没过,心情很糟糕”时,GPT-4.5不仅能够识别出这句话中的负面情绪,还能进一步感知到用户可能需要的不仅仅是解决问题的建议,更需要的是情感上的支持和安慰。

基于这种情感识别能力,GPT-4.5能够以一种富有同理心的方式回应用户。不会简单地给出一些通用的、冷漠的建议,而是会用温暖、关怀的语言来表达对用户情感的理解和支持。例如,可能会说:“哎呀,听到这个我很难过。考试没过确实会让人感到沮丧和失落,但这只是暂时的,并不能代表你的能力和价值。”

图片

这样的回应不仅能够缓解用户的情绪,还能让用户感受到被理解和关注。这种同理心的表达是GPT-4.5情商功能的核心体现,使得模型在与人类互动时更加自然、亲切,仿佛是一个真正能够倾听和理解的朋友。

此外,GPT-4.5还具备情感引导的能力。不仅能够回应用户当前的情感状态,还能够通过对话引导用户走向更加积极的情绪状态。

例如,在面对用户的焦虑或压力时,GPT-4.5可以提供一些缓解压力的方法,或者通过鼓励的话语帮助用户重建信心。可能会说:“虽然这次考试没有达到预期,但你可以把当作一个学习的机会,相信自己下次一定能够做得更好。”这种情感引导能力使得GPT-4.5不仅仅是一个被动的情感回应者,更是一个能够帮助用户调节情绪的真正人工智能。

GPT-4.5架构简单介绍

GPT-4.5的核心架构建立在无监督学习和推理能力的结合之上。无监督学习是其基础,通过海量未标注数据的训练,模型能够自主学习语言的结构和模式,从而提高其准确性和直觉能力。使得模型在处理复杂的语言任务时,能够凭借其对语言的深刻理解来生成更加自然和准确的文本。

推理能力的引入为模型增加了“思考”推理链的能力,在回答问题之前进行逻辑分析和思考,这在处理需要复杂推理的任务时尤为重要,例如,科学问题、数学问题以及其他需要深度分析的复杂问题。

在预训练完成后,GPT-4.5还使用了复杂的后训练过程。采用了监督微调和基于人类反馈的强化学习相结合的方法。监督微调通过标注数据进一步优化模型的性能,使其在特定任务上表现得更加精准。

图片

这种方法使得模型能够更好地适应不同的应用场景,提高其在实际任务中的表现。而基于人类反馈的强化学习则让模型能够更好地理解人类的需求和意图。通过与人类的互动,模型不断学习如何生成更符合人类期望的文本,从而使对话更加自然和富有情感。

在模型规模方面,GPT-4.5是OpenAI迄今为止最大的模型,其参数规模达到了前所未有的高度。为了训练这样一个庞大的模型,OpenAI开发了一系列创新的训练机制。

其中,低精度训练技术是关键之一,通过优化计算资源,低精度训练使得模型能够在有限的硬件条件下进行高效的训练。这种技术不仅提高了训练效率,还降低了训练成本,使得大规模模型的训练成为可能。

图片

OpenAI还首次尝试了跨数据中心的分布式训练。由于模型规模庞大,单个数据中心的计算资源无法满足其训练需求。因此,OpenAI利用多个数据中心同时进行预训练,充分利用了大规模计算资源,显著提升了模型的训练效率。

目前,ChatGPT Pro用户已经可以使用GPT-4.5模型,下周OpenAI将为Plus和Team用户推出。

本文素材来源OpenAI,如有侵权请联系删除

END


http://www.kler.cn/a/565966.html

相关文章:

  • HOW POWERFUL ARE GRAPH NEURAL NETWORKS?(GIN)
  • L2-043 龙龙送外卖(dfs)
  • 《Python实战进阶》No 7: 一个AI大模型聊天室的构建-基于WebSocket 实时通信开发实战
  • HTML+CSS基础知识
  • 本地安装多个JDK版本自由切换【详解 附有图文步骤】
  • springboot使用redis
  • 【现代前端框架中本地图片资源的处理方案】
  • 学Java第二十九天-----继承中的构造方法和this、super关键字
  • PyQT(PySide)的上下文菜单策略设置setContextMenuPolicy()
  • 天佐.崆峒印 异常崩溃检测分析
  • 【和鲸社区获奖作品】内容平台数据分析报告
  • 力扣-动态规划-198 打家劫舍
  • Kettle 连接 Oracle 数据库全流程指南
  • 【leetcode hot 100 438】找到字符串中所有字母异位词
  • JavaScript 垃圾回收与内存泄漏:原理与应对策略
  • Vue 3 路由管理实战:构建多页面博客导航 - 掌握 Vue Router 实现 SPA 页面跳转
  • 物理内存组织与分配的核心概念
  • tidb集群基于多副本容灾
  • DS32编译优化问题【deepseek的功劳】
  • Spring MVC 的执行流程