大模型 / 智能体在智能运维领域的应用总结与发展趋势概述
智能体 + 智能运维 = ?
回顾大模型的发展
大模型的发展在过去两年间呈现出爆炸式的增长,成为推动人工智能领域快速进步的关键力量。
- 2023年3月:百度发布了其知识增强的大语言模型产品“文心一言”,这标志着国内AI大模型产业竞争的开始,即所谓的“百模大战”。
- 2023年7月初:中国电信在世界人工智能大会上展示了百亿参数的星辰语义模型,并宣布了商业化落地过程中遇到的问题及解决方案。
- 2023年7月8日:中国移动在世界人工智能大会期间正式发布了面向政务领域的九天·海算政务大模型和面向客服领域的九天·客服大模型。
- 2023年11月11日:中国电信进一步披露了其大模型布局,包括开源开放的时间表以及首批试商用的12个行业大模型。
- 2024年2月:百度推出了多模态大模型“ERNIE-ViL”,它结合了图像识别和自然语言处理的能力,可以同时理解和分析文本与图片内容,在视觉问答、图像字幕生成等任务上表现出色。
- 2024年7月:字节跳动发布了针对教育市场的智能辅导助手,结合了自然语言处理和深度学习技术,帮助学生更好地理解和掌握知识点。
- 2024年8月:百度升级了其智能云平台,增强了对大规模预训练模型的支持力度。新的云计算架构优化了模型训练速度和推理效率,为用户提供了一个更为稳定高效的开发环境。
- 2024年9月19日:全球首个多模态地理科学大模型“坤元”在北京发布,这是我国科研团队在全球范围内的一项重要创新成果。
- 2024年11月:百度发布了最新的语音合成系统“Deep Voice 4”,该系统基于深度学习技术,可以在保持高质量语音输出的同时大幅降低计算成本,适用于各类语音交互场景。
- ……
- ……
- 2025年1月21日:腾讯开源了混元3D生成大模型2.0,专注于游戏、具身智能等领域的应用,显示了国内企业在特定垂直领域的探索和技术进步。
从大模型到智能体
不知道从哪一天起,大家聊天的时候不再讨论哪家发布新的大模型,而是哪家公司发布具有新功能的应用。比如:
-
2024年9月12日:百度在其年度大会上揭示了最新的智能体生态方案,推出了开放的文心智能体平台,开发者可以通过简单的文本指令“一句话”创建智能体,降低了开发门槛,吸引了超过10万家企业和60万名开发者参与。
-
2024年7月:阿里云进一步扩展了通义系列,发布了支持多模态数据处理的智能体“通义万相”,增强了对图像、视频等内容的理解和生成能力。
-
2024年5月15日字节跳动发布的火山引擎原动力大会上正式推出了豆包大模型,并且在之后几个月内不断扩展其能力和应用场景。
-
2024年4月:华为发布了针对金融行业的定制化智能体,优化了风险评估、智能投顾等功能,满足金融机构对于精准决策的需求。
-
联想:2024年11月30日,联想发布了国内首款IT服务智能体“联想百应”,该智能体集成了三大AI应用及五大核心技术能力,为中小企业提供了安全可靠的AI解决方案。
-
……
智能体 + 智能运维 = ?
前面介绍那么多大模型与智能体的发展,仿佛一切都充满希望,甚至给人一种 “智能体无所不能” 的 错觉
。
这里首先需要回答 第一个问题:什么是智能运维?
这里我们先摘一段大模型的回答结果:
- 智能运维(AIOps, Artificial Intelligence for IT Operations)是利用人工智能技术(如机器学习、数据挖掘和自然语言处理)来优化、自动化和智能化 IT 运维管理的技术和方法。它旨在通过数据驱动的方式帮助企业提升运维效率、降低成本、减少人为干预,并快速响应和解决系统故障。
换而言之:智能是手段,是期望;运维是目的,是根本。
那么,基于大模型,或者精心调教后的智能体,是否可靠 ? 这个问题非常非常关键。
假设,你是一名运维工程师,你需要担心某台机器响应延迟突增,需要考虑某个实例突然挂掉,需要考虑 QPS 突增是否可能存在风险,需要考虑数据库写入速率突增是否存在问题 …… 你是否愿意相信智能体,让它帮你过滤掉误报,保留甚至强调真实报警?
你可能会回答:我使用智能体仅仅用来做一些分析,它给出的结果也仅仅是给我提供参考,我不会完全相信它,所以不会给自己带来损失。
但是,这才是问题的关键。
在大模型/智能体应用在智能运维场景下之前,需要招聘一堆开发者进行研发,并且收集数据,更新知识库,不断迭代更新产品。然后在有一定把握的情况下,才能尝试让运维工程师使用。
经过这么多困难,我们才刚刚开始 !
需要考虑的事情还包括:
- 复杂的业务场景。运维领域的业务场景极其复杂,根本就不是一句话,一百句话,一万句话能讲清楚的事情,甚至业务场景还是一个动态变化的过程。即便是超长时间的运维人员,也没有办法保证自己能解决各种复杂业务场景下的运维问题,更何况目前还不够成熟的大模型/智能体?
- 复杂的真实数据。如果稍微参与过智能运维的真实场景研发,就一定会发现真实数据其实非常非常 “恶心”,换而言之,毫无美感。真实数据最最最大的价值,仅仅在于真实,而不是它具有研发价值。算法能够 cover 的数据场景目前也仅仅是一小块内容。给出一段历史数据,我们训练得到一个模型,在已有数据上表现非常好,但是真实世界很魔幻,数据分布经常发生变化。真实的数据场景是不具备稳定性的。稳定性很可能是短暂的,当且仅当业务稳定,整个世界都平静无波澜才行。但真实世界往往与童话差别很大。
- 复杂的需求场景。同一份数据,在不同的场景下可能被判定存在风险,也可能被判定非常平稳 —— 这是由需求场景决定的。哪怕是同一个需求场景,因为领导、同事的偏好不同,也可能导致大家的理解不同。这个问题在标准化之前,是无解的。
所以 ?
不知不觉写了快3000字 —— 尽管我一直在提醒自己应该做总结,而不是强调智能体在智能运维领域落地有多难。
写了这么多,回顾这近一年时间自己的真实投入,这里我必须给出一个自己的答案:经过23年与24年大模型 / 智能体 的迅猛发展,在当前场景下,智能体 + 智能运维 等于什么。
我的答案是:进展微乎其微,需要解决的问题太多,就连知识库的构建都很难做好。
但是,未来依然是美好的 ~ 共勉 ~
Smileyan
2025.01.23 23:59