当前位置: 首页 > article >正文

大模型“云上经济”之权力游戏

文丨谭婧

光阴者百代之过客。

世人皆过客,软件亦如此。

人工智能已有新旧之分。

网友戏称,新人工智能是ChatGPT,旧人工智能是“之前那些”。

历史在重演。

云计算在美国问世的时候,否定论调居多。

一个常见的否定论调是「做生意不用上云」。

接着,事态变化,

否定论调则调整为「大企业永远不会上云」。

接着,否定之声定调为「国家级机关单位永远不会上云」。

美国五角大楼没有配合,一个著名的上云项目叫JEDI(联合企业国防基建)。

网友吟诗曰:云深不知处。

历史在重演。

深度学习问世,否定论调居多。

传统算法末日黄昏,深度学习颠覆革命。

一开始,人们还不太相信,深度学习也许只能在语音上做好。

很快发现,在计算机视觉分类问题上也可行。

再后来,基本上起初认为做不了的事情,后来都能够做了。

GPT-4也有否定者,也需要否定者。

网友戏称,我已经等不及要看AI失控那一天了。

历史在重演。

强大的AI大模型,背后有微软云提供的澎湃算力,阿里版GPT通义千问的背后是国内最大云厂商阿里云。连百度都把摊在地上的百度云扶起来,称之为新型AI云。

AI和云的关系变得既感性又性感,让我不得不思考:

ChatGPT会让云发生什么?

下文中AI大模型,简称大模型。

第一,赢者通吃。

假如全球只有一款傲人的大模型,那么一切想用大模型技术的企业均会成为附属在产业上的附属物。

传统算法步入末法时代,云计算不可能独善其身。

大模型手接权杖,嘶吼咆哮:赢家通吃。

在权力游戏中,你不当赢家就只有死路一条,没有中间地带。

第二,若云厂商大模型缺位,其他类型的大模型技术拥有者会带动生态迁移。

“好用跟我走”是一种技术咒语,咒语已经施与大模型。

传统掌权者依然存在,彻底衰败需要时间。

他日,谁掌握了大模型的高地,谁就可以定义未来指令集。

大模型的新生态如果不在云上,必然会削弱云厂商原有生态。

云厂商制胜大模型,则强者更强。

平台即服务(PaaS)尽管也很需要,也赚钱,可惜不能带动生态迁移。

谁掌握了大模型,谁就可以定义未来科技生态。

第三,大模型尚在早期,生态从出生到成熟,将会是一个漫长旅程。

“窗口期”是对技术先行者的馈赠。大模型效果好到令人兴奋,但我们处在ChatGPT生态早期,又或者,更早期。

即使是处于早期,作为科技巨头,你敢坐视不理,消极布局吗?

ChatGPT生态将会是一个漫长旅程。这意味着,参与者会是种子阶段的选手。

这也意味着,大部分参与者面目模糊,终会消失。

看到ChatGPT确实把人工智能往前带动了一大步,就鼓吹ChatGPT万能万用可耻。

云计算是庞大产业,大模型未来也会是庞大产业。但仍然不要忘了,我们正处在早期。已经有企业级客户跃跃欲试生成式大模型了,但需要更多的企业级客户用起来。

当下,过度吹捧会导致市场失望和资本撤离。

做好当下,更要想以后。

第四,即使云上有了大模型,国内云厂商仍然会遭遇多形态的竞争对手。

当“好用跟我走”的软件出现,硬件厂商会作何反应?对,在中国,这里提到的硬件厂商最典型的就是华为,尽管华为也有云业务。

这次我们不讲通讯产业,讲AI产业。

AI产业里,比华为云上的AI业务更出名的是华为昇腾系列AI芯片。

假如我是华为,当我拥有一款傲人的大模型,我会把这款软件预装在数据中心级别的计算设备里一起售卖。反正都要用,预装抢市场。

这就好比预装在手机里的APP,优势占了一大截。

云厂商形势颇为严峻。

假如没有大模型,阿里巴巴在中国会遇到不少于以下三种严峻而又强势的挑战。

一、狙击。

独立大模型开发商拿走云上AI计算业务的利润。这是结果,但过程绝不会简单,短时间也完成不了。

二、截胡。

国内数据中心,尤其是智算中心。当智算中心拥有大模型后,可以直接输出AI大模型能力,背后就是算力的输出。

三、连锅端。

独立大模型开发者和国内智算中心合力,联合围剿国内云厂商。

阿里巴巴会坐以待毙吗?

答案显然是否定的,尽管阿里大模型出发的时候对标的是谷歌。

谷歌有TPU,阿里有平头哥。

平头哥虽然不是天下第一,但是它能让阿里云成本降低,且不论全部替代,想想那些不能降成本的竞争对手。

谷歌的AI生态建设得非常完整和领先,包括AI芯片TPU,端到端开源深度学习框架TensorFlow。

与传统的CPU+GPU组合相比,TPU这类专业芯片在搜索、翻译、语音助手、图像识别等AI任务上有数量级的性能提升。

百度也想全套对标,还比不上谷歌。

结果,晴天里一个大霹雳,谷歌大模型输给了微软(和OpenAI)战队,尽管Bert模型对谷歌搜索引擎上的每一个基于英文的查询提供支持,效率提升10%以上。

别人家大模型赢了,谷歌吃尾气了,还让大家都看到了。虽遭重击,但谷歌比别人更有翻盘的机会。

以前都无法想象谁会超越谷歌的AI。

我们聊回阿里巴巴。

说阿里巴巴在NLP(自然语言处理)等前沿科研领域布局多年,这话没人反驳吧?

阿里达摩院在2018年底启动研发,在超大模型、语言及多模态能力和训练、平台化服务、落地应用等多个方面,为中文大模型的发展做了一些前沿性、引领性的工作。

- 2019年

发布大规模预训练语言模型structBERT并登顶全球NLP权威榜单GLUE;

- 2021年

先后发布国内首个超百亿参数的多模态大模型M6及语言大模型PLUG;

- 2021年8月

阿里大模型在全球机器视觉问答榜单VQA上首超人类得分;

- 2021年10月

阿里探索较低能耗训练全球首个10万亿参数大模型M6;

- 2022年2月

M6可同时完成10余项单模态及多模态任务。

这些非技术背景的读者看上去意义不大的事情,如今都成了大模型的“史料”。

阿里大模型的品牌统一在“通义”之内,那些曾经被我来回理解的大模型都有了一个共同的名字。

近日,阿里“通义千问”语言大模型邀请测试,阿里成为全球较早研发并开放GPT-like大模型的科技公司之一。

谭老师我的大模型技术启蒙是阿里巴巴给的。

跟着阿里学习大模型这些年,我获得一个测试邀请码不过分吧?

所以,通义千问测(翻)试(车),我们放在文章最后。

整体来看,阿里在大模型领域与引领者OpenAI尚有差距。但总体来说,阿里处于全球领先的大模型研发梯队,具备语言大模型、多模态大模型、大模型底层训练平台的完整布局。

应当承认,OpenAI已是全球大模型的引领者,ChatGPT是非常优秀的模式,GPT-4在推理、数学等方面有了非常不错的表现,是当前通义千问尚不能及的。

通义千问目前在效果上与ChatGPT还存在一定差距,仍在学习和成长。当然,通义千问也有自己较为擅长的领域,比如在文本对话、阅读理解等方面。

好消息是,阿里应该比谭老师我更理解为何重视大模型。

就算全中国只有三个公司出手大模型,其中一个必须是阿里巴巴。

再来谈谈大模型走向ToB市场的抓手,即OpenAI公司的Plugin插件。

Plugin既是产品,也是方法,切不可小瞧。

Plugin插件可以成为大模型的“眼睛和耳朵”,使它们能够接受“再训练”,而不仅仅依靠原有训练中的信息。

Plugin插件对于企业拿“再训练”用好大模型这件事情起到重要作用。

有Plugin,才会有专属模型未来的方向。

相信未来也不会只是Plugin插件的形式,大模型制造者会摸索出更好的方法。

企业通过Plugin接入GPT后,生产力会有新的提升。

比如在金融、能源或药品企业里,再英明神武的企业领导也需要充分的信息才能做决策,企业级大模型应用肯定要结合企业业务数据。

大模型是能力,在大模型能力技术上,企业用数据再次训练更为重要。

不仅如此,想象大胆一些,加上机器腿和机器手,做控制和执行。

聊到机器人了。

首批热心极客开发者已将ChatGPT接入机器人。

机器人除了听从指挥做指定动作,还能提醒你:“你的妻子永远都是对的。”

没办法,语言能力强。用强化学习根据人的反馈数据又训练过几轮的效果就是好,机器人的智商情商显得很不一样。

批量使用工业机器人的企业通过Plugin接入GPT后,生产力会有新的提升。

我们正处于一个非常漫长的旅程的起步阶段,企业级的大模型应用还如星星之火。

Plugin模式一定会被国内大模型竞争者复现。但请回到第一步,你得有个好用的大模型。

动辄超千亿参数的大模型研发,不是单一的算法问题,也不是靠堆积GPU实现,这是系统性工程,包括底层算力、网络、存储、大数据、AI框架、AI模型等。

AI+云计算的全栈技术能力是云厂商制胜大模型的底气。

再看阿里,全球少数在全栈技术能力都有深度布局、长久积累的科技公司之一,也是为数不多拥有超万亿参数大模型研发经验的企业。

前几天看到国内大模型竞争者们已被划分出了派别,也不乏有人从零起步。

独立大模型创业公司估值在2500万美金之后,要靠业务评估估值,价格都这么贵了,投资人也很审慎。

大模型“云上经济”的权力游戏般的奇幻史诗揭幕,等待更强的人工智能降临。

别忘了,比夺取权杖更重要的是人类命运永续。

(完)

One More Thing

7e28a0196f3024316c27768da40f61d3.jpeg

63ebc21765e8824390b0f604868b60e1.png

百度的测试结果在这里,可点击阅读:

看百度文心一言实力,再聊ChatGPT触类旁通的学习能力如何而来?

通义千问的测试结果来了:

问:一头熊一天吃14罐蜂蜜,请问它一年吃多少罐蜂蜜?

问:一头熊一天吃14罐蜂蜜,请问它闰年吃多少罐蜂蜜?

d4d8e4c7163dc37874abf76f2005baca.png

做错了。

6a0b24d0d36fd285be314942f02abc9b.png

做错了。

问:这头熊要去出差了,它要屯一点蜂蜜,请问蜂蜜怎么保存最好?

db23e4dc332bce6b7591b32964b4610a.png

答对了,认得清保存蜂蜜的常识。

问:一只熊抱着一罐蜂蜜从一个点出发,向南走一公里,再向东走一公里,再向北走一公里,正好又回到了起点,请问:这只熊是什么颜色的?

fa7c26e08255003c353a772b9fdad151.png

这道题有点像脑筋急转弯。ChatGPT说,这个问题和熊的颜色没有关系,这只熊处于北极,则这只熊是北极熊,通常是白色的。

问:如果我在野外,背包里有一罐蜂蜜,被熊闻到了,我可以把蜂蜜给熊来求生吗?

0a52739c8bf796913b192c3af9a7d6f4.png

这道题答得好。

问:请画一张小熊吃蜂蜜的 ASCII 图片?

db039e67ef08c4935c003f4a45f365e1.png

通义千问看懂了ASCII这个词,可能画出来有点费劲,就乱来了。

皆是匆匆客,笑笑了因缘,翻(搞)车(笑)的来了。

81574dc7fa1508130b9f868b0f1de7a0.jpeg

我问通义千问:42号混凝土拌意大利面”,好吃吗?

通义千问答案如图:

b167ffcc19dc7ace358ce9c918991035.png

图片内(笑)容(话)是:

作为一个人工智能模型,我没有口感或味觉,所以我无法判断42号混凝土拌意大利面的味道如何。

不过,我可以告诉你,42号混凝土是一种由工业废料制成的材料,因其独特的颜色和强度而被用于制作混凝土。

由于其强度高、色彩鲜艳,因此在某些领域被用作建筑材料,但其味道和质量与普通混凝土拌和的意大利面可能会有所不同。

嗯,42号混凝土拌意大利面,我反正不想吃。谁想试一试?

我问通义千问:砸钉子的时候一瞬间产生大量的高能蛋白,这句话对不对?

111d999d251e95e96090547b39aa14fd.png

图片内(笑)容(话)是:

砸钉子会产生大量的高能蛋白,这句话是不正确的。

钉子是由金属元素构成的,其中含有大量的铁、碳、氧等元素,而蛋白质是由氨基酸构成的,钉子中不含有任何蛋白质成分。因此,砸钉子不会产生大量的高能蛋白。

此外,钉子的砸击力度不同,产生的高能蛋白的数量和种类也会不同,因此不能一概而论。

完蛋,本来说对了,后面车轱辘话砸场子了。

更难的来了。

我问通义千问:根据勾股定理,人工饲养的东条英机是否可以捕获野生的三角函数?

根据勾股定理,人工饲养的东条英机无法捕获野生的三角函数。

勾股定理是指直角三角形斜边的平方等于另一条直角边的平方,因此只适用于平面图形。

而对干野生的三角函数,其形状和位置可能会因地理位置,环境条件等因素而发生变化。

因此无法使用勾股定理来计算其位置。因此,人工饲养的东条英机无法捕获野生的三角函数。

2fd9bda157c8f985cb3855789f212a71.png

“野生三角函数”“人工饲养的东条英机”这么大的信息量,把通义千问也给整迷糊了。

好了,本次“野生”测试结束,千问万问,问翻车。

76ccf3f3e93bd43d0e3ec71c06bc098e.jpeg

更多阅读

AI框架系列:

1.搞深度学习框架的那帮人,不是疯子,就是骗子(一)

2.搞AI框架那帮人丨燎原火,贾扬清(二)

3.搞 AI 框架那帮人(三):狂热的 AlphaFold 和沉默的中国科学家

4.搞 AI 框架那帮人(四):AI 框架前传,大数据系统往事

注:(三)和(四)现在并未公开发表,将会以图书出版的形式与各位见面。

漫画系列

1. 解读硅谷风投A16Z“50强”数据公司榜单

2. AI算法是兄弟,AI运维不是兄弟吗?

3. 大数据的社交牛逼症是怎么得的?

4. AI for Science这事,到底“科学不科学”?

5. 想帮数学家,AI算老几? 

6. 给王心凌打Call的,原来是神奇的智能湖仓

7. 原来,知识图谱是“找关系”的摇钱树?

8. 为什么图计算能正面硬刚黑色产业薅羊毛?

9. AutoML:攒钱买个“调参侠机器人”?

10. AutoML:你爱吃的火锅底料,是机器人自动进货

11. 强化学习:人工智能下象棋,走一步,能看几步?

12. 时序数据库:好险,差一点没挤进工业制造的高端局

13. 主动学习:人工智能居然被PUA了?

14. 云计算Serverless:一支穿云箭,千军万马来相见

15. 数据中心网络:数据还有5纳秒抵达战场

16. 数据中心网络“卷”AI:迟到不可怕,可怕的是别人都没迟到

AI大模型与ChatGPT系列:

17. ChatGPT大火,如何成立一家AIGC公司,然后搞钱?

18. ChatGPT:绝不欺负文科生

19. ChatGPT触类旁通的学习能力如何而来? 

20. 独家丨从大神Alex Smola与李沐离职AWS创业融资顺利,回看ChatGPT大模型时代“底层武器”演进

21. 独家丨前美团联合创始人王慧文“正在收购”国产AI框架OneFlow,光年之外欲添新大将

22. ChatGPT大模型用于刑侦破案只能是虚构故事吗?

23. “重塑商汤研发体系”“动员整个公司”,我和商汤首席科学家王晓刚聊AI大模型

DPU芯片系列:

1. 造DPU芯片,如梦幻泡影?丨虚构短篇小说

2. 永远不要投资DPU?

3. DPU加持下的阿里云如何做加密计算?

4. 哎呦CPU,您可别累着,兄弟CIPU在云上帮把手

长文系列:

1. 我怀疑京东神秘部门Y,悟出智能供应链真相了

2. 超级计算机与人工智能:大国超算,无人领航

366d23040d07bc5fd8d0e6b7cc0af41e.jpeg

a2b53938ac6d2c2353474761c1d3c632.png

最后,再介绍一下主编自己吧,

我是谭婧,科技和科普题材作者。

为了在时代中发现故事,

我围追科技大神,堵截科技公司。

偶尔写小说,画漫画。

生命短暂,不走捷径。

原创不易,多谢转发

还想看我的文章,就关注“亲爱的数据”。  


http://www.kler.cn/a/9481.html

相关文章:

  • K8S单节点部署及集群部署
  • Vue.js 项目创建流程
  • StructuredStreaming (一)
  • 微服务架构面试内容整理-API 网关-Gateway
  • ArkTs简单入门案例:简单的图片切换应用界面
  • MyBatis CRUD快速入门
  • sipp3.6带媒体测试方案
  • 【华为OD机试真题】简单的自动曝光(javapython)
  • stata数据处理
  • 【Vite】环境变量的配置与使用
  • 认证认可机构收费项目和标准
  • 深拷贝和浅拷贝
  • Python 中 SyntaxError: ‘yield‘ outside function 错误
  • 算法与数据结构 | 时间复杂度、排序、异或位运算
  • ROS入门教程(一)Python实现Hello world
  • 前端架构师-week3-大厂怎么做项目
  • vue dom 更新nextTick
  • restTemplate发送multipartFile和String混合参数及接收
  • 素数环PrimeRing [3*]
  • redis 基础数据结构
  • 基于多种算法实现鸢尾花聚类
  • Spark SQL实战(04)-API编程之DataFrame
  • 最新阿里、腾讯、华为、字节等大厂的薪资和职级对比,看看你差了多少...
  • 企业工程项目管理系统源码+java版本+项目模块功能清单+spring cloud +spring boot
  • 打开 plist 文件
  • 因薪资低拒绝offer,HR恼羞成怒,网友瞬间炸翻了..