当前位置: 首页 > article >正文

GPT-6曝光!阉割版「草莓」秋季兑现

图片

 夕小瑶科技说 原创
 作者 | 海野

OpenAI的Q* 项目,也就是后来在网上沸沸扬扬的Strawberry草莓,终于定档于秋季上线。

据The Information爆料,作为GPT-4的下一代,Strawberry很惊艳:

  • 拥有极强的推理和数学能力;

  • 减少了幻觉问题;

  • 能够主动进行“思考”,解决复杂的问题(耗时较长)。

根据路透社的报道,早在七月份,OpenAI就已经向美国国家安全局展示过这个模型的技术。OpenAI内部也已经在使用这个新的模型。

而在八月初,Sam Altman发布了一些带草莓照片的推文,这种暗示不言而喻:昭告所有人,草莓模型要来了!

图片

哎……它真来了吗?OpenAI卷起了草莓狂欢热,却没有带来对应的期货。互联网上逐渐出现一些质疑声,痛批OpenAI的无实物炒作。

图片

与此同时,OpenAI的其他弊病也被披露出来:

已经预告了数个月的sora模型,迟迟没有上线;

searchGPT暂停开放测试;

GPT-4o的语音功能依然在waiting list,仅限少部分人使用。

以Claude为首的各家大模型,逐渐在不同方面超越了GPT-4o,而OpenAI并没有进行反击,也没有带来更强的新模型。

等等等等……

直至今日,OpenAI依然在巨大的舆论风波之中。终于,OpenAI带来了一个振奋人心的消息:Strawberry不是终点,我们开始用Strawberry训练新的模型Orion !

而关于Strawberry模型的问题,OpenAI也做出了回应

为什么迟迟没有上线?

一言概之就两个问题:安全和竞争。

关于安全问题,我们看OpenAI最近常发的文章就可以知晓:

图片

图片

图片

OpenAI在安全方面做出了很多举措。由于发布安全问题推文的频率之高,OpenAI甚至被网友们戏称,应该改名为SafeAI。

但即便是这样的安全保障举措,依然没有讨得美国国家安全局的芳心。

此前,因为人工智能发展速度过快,安全和监管没有起到应有的效果,人工智能先驱Yoshua Bengio决定与人工智能教父Geoff Hinton一起,投入更多精力来倡导人工智能监管。

图片

另外,美国国家安全局的另一个考量是,要防止其他国家使用strawberry模型合成数据,从而训练出更强大的模型。

出于各种安全考虑,Strawberry模型被禁止直接向公众提供服务。

所以,接下来在秋季公开的Strawberry,也是一个小型的蒸馏模型,削弱了推理能力,更主要的用于聊天。不过也能满足公众的个人使用需求。

根据预测,Strawberry聊天模型可能会在十月Devday的时间上线;也有可能会在十一月美国大选结束后上线。

图片

Strawberry模型的完全体,则会在OpenAI的内部使用,用来生成高质量的合成数据,训练Orion模型——GPT-6。

而OpenAI选择这样举措的原因,就是竞争的问题了。

OpenAI,选择了更进一步封闭

OpenAI放弃了strawberry完全体(GPT-5)模型的发布,转而训练更先进的模型Orion,以确保自己能断崖式的碾压竞争对手。

图片

OpenAI似乎忘记了自己的原始使命(开发开源技术造福人类),转而走向了闭源和盈利。而对于这项选择,我们也不难看出OpenAI的考量:

为什么在GPT-4上线后,各竞争对手以及开源模型,进步速度突飞猛进?因为GPT-4经常被用于合成数据,这些合成数据就会被用来训练其他家的模型。

要知道,优质的大模型往往建立在庞大的数据集的训练上,而现有的公开真实数据,早已被各家厂商用遍了。拉开差距的方法之一,就是使用人为创建的合成数据。创建合成数据使用的模型越先进,数据集越强大。

图片

为了避免这种情况继续发生,为了保持领先地位,OpenAI只能选择闭境自守,用下一代模型训练下下代模型,从而实现遥遥领先。

如果OpenAI真的可以实现如此成效,那各大开源模型可能要狠狠地吃瘪了。这一场比赛很可能会演变成一次文明的游戏。

OpenAI的动向也透露出一个信号,也许不久后,这种超级AI会成为新的封闭的资源,对其进行掌握和控制,会成为下一轮科技竞赛的核心。


http://www.kler.cn/a/279940.html

相关文章:

  • Pytorch 模型保存与加载
  • [论文笔记] megatron 大模型超参搜索pipeline
  • 10款免费电脑录屏软件盘点,2024年最新录屏工具排行榜
  • 数据结构与算法——动态规划
  • 并行动力:用PyTorch在多GPU上释放深度学习潜能
  • UE5 蓝图 计算当前时间段
  • 大模型实战-FinGLM解析金融财报做RAG经验参考篇
  • Ado.Net基本操作
  • CSS属性
  • 命令模式在手游后端的应用
  • 云端Ruby:将应用无缝融入云服务的艺术
  • 除了tcp和udp以外的其他传输协议
  • 文档翻译软件哪个好用?这里有5个顶尖选择
  • 折腾 Quickwit,Rust 编写的分布式搜索引擎-官方教程
  • Spring Boot自定义注解
  • SQL进阶技巧:用户不同 WiFi 行为区间划分分析 | 断点分组问题
  • 磁盘挂载
  • 大模型面试八股,Offer拿到手软
  • 前沿重器[55] | prompt综述的解释和个人思考
  • FreeRTOS学习笔记>内存管理