当前位置: 首页 > article >正文

AI时代,百度的三大主义

图片

现实主义、长期主义、理想主义


定焦One(dingjiaoone)原创

作者 | 苏琦 郑浩钧

编辑 | 魏佳

“人工智能很像是一次新的工业革命,这意味着它不会三五年就结束,也不会一两年就出现‘超级应用’,它更像是三五十年对于整个社会一次彻底的重构。”

11月12日下午,李彦宏与硅星人创始人骆轶航,以及甲子光年创始人张一甲进行了一场“AI圆桌对谈”,再一次表达了他对AI的信仰,同时阐释了百度在AI上的战略和思考。

这场对谈也是对当天“百度2024世界大会”的延续。世界大会上,李彦宏发布了文心iRAG、无代码工具“秒哒”、自由画布等核心技术和产品,宣告“AI应用的群星闪耀时刻已然到来”。

李彦宏在对谈中表示,将此次百度世界大会的主题定为“应用来了”,是出于“有用”这一价值观。他表示,模型本身不产生直接价值,只有在模型之上开发各种应用,在各种场景找到所谓的PMF(产品市场契合),才能真正产生价值。“如果说2023年大家还在卷模型,让模型能力逐步地达到可用地步的话,那未来所谓的‘可用’,就是真的有东西用,应用的‘用’。”

自百度成立以来,李彦宏一直在AI领域进行前瞻研究和清醒布局。这样的坚守需要定力,也有厚积薄发的力量,不仅能带着百度朝前走,也能给行业带来理性的声音。

李彦宏的布道之路还在继续,他在圆桌访谈中表露心声:“在这条路上,需要长期主义、理想主义和现实主义的结合。”

这三大主义,也在李彦宏多年的AI探索中得到体现。

图片

现实主义:

解决幻觉难题,降低使用门槛

一年前,李彦宏曾呼吁,“大模型本身不仅不产生任何价值,还造成了对公司资源、社会资源的巨大浪费。” 

如果不做通用大模型,创业者应该做什么?当时李彦宏给出的答案是:AI原生应用,“我们需要的不是100个所谓的大模型,而是100万量级的AI原生应用。”

时间过去快两年,超级应用却迟迟没来,原因一方面是部分应用的技术有硬伤,例如文生图幻觉严重,中看不中用;另一方面是应用开发门槛太高,不够智能。在2024百度世界大会上,李彦宏带来两个杀手锏:iRAG(检索增强的文生图技术)和秒哒,解决了上述两大现实存在的技术难题,宣告“AI应用的群星闪耀时刻已然到来”。

图片

百度之所以选择做iRAG,是从现实的用户需求出发进行的倒推。李彦宏在访谈中提到,应用需要大模型能力,而大模型想要具备实用价值就需要有效控制幻觉生成,所以团队开始研究iRAG技术,并开发在ToB场景的应用。

同时,多模态要想进入真正实用阶段,也得有准确性和可控性,应用空间才能打开,这同样离不开iRAG。

iRAG技术作为大模型的一项基础技术,在影视作品、漫画作品、海报制作等几乎所有的创作场景,都能有广泛的应用空间,且可以大幅降低创作成本、提高创作效率。

李彦宏在对谈中举例,比如以前汽车的实拍宣传海报动辄需要十几万元,如果运用iRAG,不仅创作的成本接近于0,还能在保持车该有的形态的前提下,放飞人们的想象,创作出真正有创造力的故事情节,宣传也会更吸引人。

无代码工具“秒哒”的发布也让人兴奋。现在硅谷很重视辅助代码生成,美国很缺工程师,所以现在很多技术和工具都是用来提升这些工程师的效率。

但是百度的思路是,除了能让金字塔塔尖的人更加有效率优势,还想做出一款工具让金字塔中间层和底层的人,都拥有金字塔塔尖这些人的能力。

随着基础模型和智能体的能力逐步提升,百度把这些能力综合在一起,发布“秒哒”,让一行代码都看不懂的人具备程序员的能力。“当几亿、十几亿人都具备这种能力的时候,它对于创造力的爆发,是辅助代码生成工具无法比拟的。”李彦宏表示。

上述两大技术是李彦宏AI现实主义的体现,但这条“实用之路”也是一个逐步发展的过程,不会一蹴而就。“但它是非常有希望的赛道,一个人今天能够写两百行代码,一年以后可能能写两千行代码,再过三年可以写两万行代码,这个能力会逐步发展出来,激发更多人的创造性。”李彦宏在对谈中称。

图片

长期主义:

10年投千亿,应用终爆发

很多人提到巨头做AI和创新,最大的负担是legacy(遗产),但是李彦宏在访谈中直言,百度真正的legacy就是“相信AI”,“一旦你把这个东西当成legacy,很多东西就都很好解释,我就是在做我多年前一直想做的事。无论是深度学习、机器学习还是产品积累,一切都源自百度信AI,不是今天才信,也不是两年前信,是十几年前就信这个东西。”

在大学时期就学习AI相关课程的他,很早就意识到AI是解决搜索引擎问题的核心技术,所以过去10年间百度投入1700亿研发和布局AI。他不仅自己信仰AI,还鼓励公司和社会关注AI,2012年,距离OpenAI成立还有3年,他就发布全员信鼓励全百度产品经理了解AI技术。2013年,他在百度年会上宣布成立深度学习研究院并担任院长。

李彦宏曾在2021年的《致股东信》中写道,“过去10年,我们打基础、建生态,在人工智能大潮奔涌而来的今天,百度成为了领先的AI生态型公司。”

正因为搭好了基础,如今才有了数以千万计的智能体和数十万的产业应用在百度的AI生态中涌现。

百度是少见的将智能体作为最重要战略方向的公司。根据用户的不同需求,李彦宏将智能体分为四类,包括公司类智能体,角色类智能体,工具类智能体和行业类智能体。

百度之所以将智能体看得如此重要,不仅因为其开发门槛低、天花板足够高,还看到了智能体与搜索结合,能拓展搜索的边界。

图片

换句话说,百度不仅提供基础大模型和应用开发工具,还提供分发渠道,在百度里搜相应的词,搜出来的结果有可能就是一个智能体。目前,百度新搜索已经成为了智能体分发最大入口,日均分发已超1000万。

李彦宏在访谈中解释,当百度的AI生态里拥有大量智能体的时候,能够将人的需求和智能体进行高效匹配和连接的渠道,还是搜索。同时,人与智能体需要多轮交互,甚至需要调用工具解决问题,这两者的结合拓展了搜索的边界,能打开更多新的可能性。



随着应用开发门槛的降低、智能体的增加,百度文心大模型的调用量也在迅速增长。据百度官方透露,目前文心大模型的日均调用量已超过15亿,较一年前首次披露的5000万次,增长近30倍。

李彦宏在访谈中分享了自己的观察,文心大模型最近两个月调用量的陡升背后是开发者群体的觉醒,他们逐步意识到可以用模型做出应用,这样的需求足够旺盛。

除了智能体,一些像百胜中国、智能招聘这样的公司,也因为和百度的合作,在它们具体的业务场景里,能够更加高效、更加低成本、更加快速的获得实实在在的收益。

百度构建智能产业生态的主要依托是百度智能云。目前在百度智能云的千帆大模型平台上,已经累计精调了3.3万个大模型,开发出了77万个企业级应用,百度智能云已经拥有中国最大的大模型产业落地规模,60%的央国企以及大量的民营企业,都在联合百度智能云进行AI创新。

目前,百度已经发布基于大模型的100大产业应用,涵盖制造、能源、交通、政务、金融、汽车、教育、互联网等众多行业。

图片

理想主义:

从AI拓荒者成为领跑者

虽然此次百度世界大会发布的更多是人人可用的产品,李彦宏的演讲也没有谈很大的命题,但是他身上仍表现出了“理想主义者”的影子。

一方面,百度把很多研发资源投在了“理想主义者”看重的东西上面,李彦宏在访谈中提到,“我们不断地在这方面加大投入、付出努力,没说并不代表没有做”。另一方面,李彦宏过去24年的AI信仰和沉淀,本身就是一种“清醒的理想主义”。

这个清醒体现在面对困境不迷茫,在2020年上海世界人工智能大会上,面对行业的低迷,李彦宏表示当下人工智能所处的阶段,是一个容易产生迷茫甚至悲观的阶段,这是大多数颠覆性技术在加速普及之前的必经阶段。“百度也曾从这样的低谷期爬出来过,所以我相信熬过寒冬就能成为新的英雄。”

这个清醒还体现在,市场冷清时率先布局、耐心坚守;市场热闹时消除噪音,看到潮水真正的流向。

相比于很多其他公司,在2022年11月OpenAI发布ChatGPT后才匆忙进入大模型领域,百度的文心大模型1.0版本早在2019年3月就发布。而当国内生成式大模型的浪潮来袭,李彦宏又呼吁不要卷大模型,应该专注实际场景,重视应用。这样的表态,在当时的环境下需要极大的勇气,事后证明,这其实就是全球主流的AI方向。

图片

2022年底创立的Perplexity.ai,创建了一种高效直接的搜索体验,百度也在去年3月发布文心一言App。到今年,各类以大模型为基础的国产智能助手遍地开花,再一次验证了李彦宏的猜想。

最前沿的技术浪潮是等不来的,浪潮到来前的每一步也都不会白走。这种对AI始终如一的信仰和清醒,给了百度更大的信心和回报。李彦宏带领的百度已经成为一个拥有广泛用户基础的AI生态型公司:在深度学习、对话式人工智能操作系统、自动驾驶等前沿领域均已深度布局。

过去三十年,中国的电脑行业和手机行业飞速发展,但遗憾的是,在这两个行业中,还没有出现中国操作系统巨头,李彦宏更大的理想,或许是让百度成为AI时代“操作系统”的最后胜利者。“我们的主要精力放在做工具、做基础平台,让大家更容易的在这上面开发应用。”

对于百度来说,搭建基础设施,在把自身优势放到最大的同时带动更多人一同开发创造,这是比取得某个单项赛道的胜利更有想象力、更有价值的事情。

2021年李彦宏在《致股东信》中曾写道,“每当百度徘徊在十字路口,我都会问自己,什么才能够让人真正制胜未来?”他给自己的答案是两方面:一是你信仰什么,二是你有多大的决心。

过去24年,李彦宏和百度对AI的信仰没有一丝改变,唯一改变的是,他们正在离自己的信仰越来越近。


http://www.kler.cn/a/409120.html

相关文章:

  • 《图像梯度与常见算子全解析:原理、用法及效果展示》
  • cangjie (仓颉) vscode环境搭建
  • 波点音乐自动点击
  • 【Opencv学习】PART1-图像基础处理
  • Linux中,防火墙基本操作指令
  • 微网能量管理研究
  • 单片机电路基本知识
  • RabbitMQ简单应用
  • 数据库MYSQL——表的设计
  • Python 网络爬虫操作指南
  • 服务器数据恢复—DS5300存储硬盘指示灯亮黄灯的数据恢复案例
  • 数据结构——树与二叉树
  • 【docker了解】如何将x86镜像转换为适用于Jetson的ARM镜像
  • 【C++动态规划】1411. 给 N x 3 网格图涂色的方案数|1844
  • el-table最大高度无法滚动
  • 探索 RocketMQ:企业级消息中间件的选择与应用
  • Scala全文单词统计
  • 【TEST】Apache JMeter + Influxdb + Grafana
  • 小程序25- iconfont 字体图标的使用
  • mfc100u.dll是什么?分享几种mfc100u.dll丢失的解决方法
  • Vue——响应式数据,v-on,v-bind,v-if,v-for(内含项目实战)
  • 周末总结(2024/11/24)
  • HTMLCSS:3D金字塔加载动画
  • MySQL 主从复制之多线程复制
  • 【数据结构】【线性表】一文讲完队列(附C语言源码)
  • el-table的树形结构后端返回的id没有唯一键怎么办