AI大模型争议的背后,是技术以人为本的初衷
去年底,一款现象级应用ChatGPT开始风靡全球,也让其背后的AI大模型迅速出圈,成为众说纷纭的热门话题。
年后,OpenAI GPT-4以及国内诸多AI大模型的陆续发布,让市场热度有增无减。不过,一份包括马斯克在内1000名科学家联合签名也接踵而至,呼吁暂停所有先进AI大模型训练六个月,担心它“对社会和人类构成潜在风险”,此举引发极大争议。
无独有偶,在博鳌亚洲论坛2023年年会的“人工智能赋予美好生活”分论坛上,AI技术发展与人类社会未来也引发了众多专家的激辩。
本质上,近期诸多AI热点事件都揭示:任何先进技术的初衷都是以人为本,当AI技术带来颠覆性变革之际,需要密切关注与排除潜在风险,寻找到合适的产业化方向,从而使之与人类更好地共存、协作。
AI大模型为何会争议不断
毫无疑问,AI大模型是近年来最为热门的AI细分领域。
相比于小模型数据有限、能力有瓶颈,定制化、碎片化情况严重,以及缺乏规模化复制和涌现能力,AI大模型则具备多个场景通用、泛化和规模化复制等诸多优势,被视为是实现 AGI(通用人工智能,Artificial General Intelligence)的重要方向。
事实上,AI大模型更像是AI发展到一定阶段的一个集大成者,将过去多年出现的各种AI技术综合运用,再辅以优秀的数据和足够的算力,逐渐展现出令人惊艳的强大能力。
在博鳌亚洲论坛上,专家们普遍认为未来几年将迎来AI技术的红利期,并且AI发展速度远超人们早前的预期。“ChatGPT是人工智能领域里程碑的事件。预训练大模型所体现出的能力,表明通用人工智能并非遥不可及。预训练大模型可以复制和商用,它带起的这一波人工智能浪潮,将不仅改变人机交互的方式,还将极大提升高生产力。”华为云人工智能领域首席科学家、国际欧亚科学院院士、IEEE Fellow田奇如是说。
但AI大模型惊人的迭代发展速度,也正在带来失业、教育和信息安全等诸多问题,潜在危险可能犹如“潘多拉魔盒”,逐渐让一部分人开始心有余悸,甚至开始呼吁暂停AI大模型的训练。就像ChatGPT之父Sam Altman所言:AI会带来危险,不仅是未来,也包括现在。
因此,AI的可靠性和安全性一定是当下与将来必须重视的领域。田奇认为:“一是国家需要尽快出台相关政策,防止AI产品滥用;二则是在技术层面确保AI产品的可控与可靠,像文生图、问答等可能会涉及到伦理等问题,需要注重数据隐私与安全和提高模型的可解释性。”
不过,纵观人类发展历史,任何新技术、新工具的出现都伴随着各种争议,AI也不例外。当AI大模型对于社会生产力的推动作用已经愈发明显之际,我们没有理由因噎废食。从长远看,AI进入到多个行业已经按下加速键,利用AI降本增效、解放生产力成为大势所趋。
AI for Industries将成下一个爆点?
当前,AI大模型在能力上的巨大进步,首先使得个人层面的生产力与创造力得到解放成为可能。因此,各大互联网公司纷纷拥抱AI大模型,结合自身已有业务场景,重塑各种产品与服务。
例如,利用GPT技术与搜索引擎结合,可以带来更加精准和更好的使用体验;电商的智能客服接入GPT技术,则可以提供更符合人类对话逻辑的客服体验;利用GPT技术与办公软件、会议软件结合,大幅提升效率等等……
接下来,从产业变革与升级的角度看,AI for Industries将成为人工智能接下来的爆点,AI与各个行业的结合将会走向深度。例如,在垂直金融领域,彭博公司已经发布了BloombergGPT,在海量金融数据的基础上,为金融分析师提供服务,标志着通用大模型与金融行业深度结合的开始。
“AI会从比较大众化的服务切入。不过对于中高端客户服务或者一些困难问题,还需要人机结合。”平安银行行长特别助理蔡新发在博鳌亚洲论坛上表示道。
那么,大模型被视为解决各种AI挑战的重要路径,未来又应该如何真正支撑起AI for Industries?
田奇直言:仅仅具备大模型并不够,还需要具备大模型与行业的连接,另外就是垂直发挥大模型作用的机制。
具体来看,大模型与行业的连接,意味着大模型需要真正降低使用门槛和结构成本,便捷地为各个行业用户所使用。众所周知,从2018年开始,大模型迎来了飞速发展期,每1-2年就迭代一次,每次迭代带来的模型参数均为指数级增长,模型的复杂度越来越高,并且对于算力要求越来越高,训练成本与测试成本水涨船高。
“大模型将成为AI的操作系统。从使用和成本多个角度,大模型接下来会加速与硬件的适配,上面所有的AI算法可以围绕大模型进行构建和应用。”田奇判断道。
田奇的比喻可谓是恰如其分。操作系统的核心作用就是对下管理各种硬件和数据,对上支撑起各类应用。田奇认为,大模型的快速发展,会推动人工智能大平台趋于统一:
- 数智融合平台架构的统一:通过融合的数据和AI新架构,打通大数据和人工智能,实现统一管理、一数多用、敏捷用数;
- 深度学习架构的统一:基于transformer架构的各种神经网络,将广泛应用于计算机视觉、自然语言处理、多媒体分析等各类问题中;
- 人机交互方式的统一:允许人类通过自然语言等方式与AI交互,完成各种任务,改变针对每个任务单独设计算法的局面。
虽然AI大模型则具备场景通用、泛化和规模化复制等优势,但如果需要深入解决复杂的各大垂直行业场景问题,AI大模型融入行业知识被视为是重要的机制与技术路径。
例如,华为云盘古大模型包括基础大模型(L0)、行业大模型(L1)、行业细分场景模型(L2)三大阶段的成熟体系。在该体系下,将知识计算能力融入盘古大模型,将行业知识融入到行业大模型中,加速行业AI应用。
比如,在医药领域,华为云盘古药物分子大模型是结合盘古科学计算大模型和药物研发机理开发的一个行业大模型,通过盘古药物分子大模型,华为云已经帮助西安交通大学第一附属医院等多家医疗机构缩短药物研发周期。
又如在煤矿领域,华为云盘古矿山大模型覆盖矿山采、掘、机、运、通等主业务环节,帮助诸多能源企业大幅缩短模型开发时间。在晋能控股集团,盘古矿山大模型基于矿山行业的大量数据学习训练,在主运皮带异常监测、掘进作业动作规范性识别等场景均取得极高准确率,为人工智能在矿山行业的应用树立了标杆。
再如,在气象领域,华为云盘古气象大模型1小时-7天预测精度均高于传统数值方法(欧洲气象中心的operational IF),同时预测速度提升10000倍,在极端天气、热带风暴等预测方面,大幅超过传统方法。
据悉,自2021年发布盘古大模型以来,华为云陆续推出了矿山、药物分子、电力、气象、海浪等行业大模型。
“未来,AI大模型不断与行业知识融合,会让AI成为新的基础设施,就像水和电一样便捷。”田奇表示道。
适应有大模型的未来
管理学家彼得德鲁克说:“巨变时代最大的危险,不是巨变本身,而是仍然用过去的逻辑做事情。”
显然,随着AI大模型的快速落地,AI正在对媒体、教育甚至计算机等多个行业产生巨大影响,甚至短期内开始影响到一些工作岗位的数量。面向未来,AI一定会成为企业和个人工作中不可或缺的部分,会被广泛应用。
“未来人人可以拥有一个通用大模型,就像大型机到PC机的转变一样 。”田奇如是说,“个人需要积极拥抱变化,学习AI和适当做转型。”
虽然AI技术的普及和发展,逐渐开始引发一系列问题,如数据隐私、失业问题、人类对机器过度依赖等。但随着国家对于AI的忠实,以及相应的政策和规范的加速制定,人工智能必然会给行业和个人带来生产力释放,赋予更加美好的未来。