当前位置: 首页 > article >正文

百度如何打造AI原生研发新范式?

👉点击即可下载《百度AI原生研发新范式实践》资料

2024年10月23-25日,2024 NJSD技术盛典暨第十届NJSD软件开发者大会、第八届IAS互联网架构大会在南京召开。本届大会邀请了工业界和学术界的专家,优秀的工程师和产品经理,以及其它行业领军人物,分享交流经验和心得。

百度文心快码总经理,工程效能部总监臧志出席大会开幕式,并分享了《AI原生研发新范式的实践与思考》。在大模型赋能下,研发过程正在发生一场深刻变革。面对这样的变革,如何在公司和行业中拥抱和落地,是百度一个重要的探索方向。

在本次大会上,臧志阐释了AI原生研发新范式的内涵,分享了从两个方面快速推动建设和落地的经验。一方面,是推进以数据+大模型为基础的研发方式,实现需求交付模式的变革,也称为AI换道交付。另一方面,是推进AI赋能和重构研发的全流程,实现生产力的倍增,称之为人机协同。

具体来看,以数据+大模型为基础的研发方式,将围绕着大模型作为核心的能力供给,通过Prompt工程和数据工程,来实现需求的交付。对于Promot工程来说,是通过改变自己,来适配和发掘大模型在目标任务上的表现,是大家最常用和首先应该使用的方式,也是百度各个应用侧最普及的方式。而数据工程,则比较复杂,在通过Prompt不容易达成目标任务效果的时候,则需要针对任务来准备数据,改变大模型,来支撑我们的能力。

想要在整个公司落地这套研发方式,需要有一整套体系来沉淀大家的实践经验,形成正向循环和平台化的效应。除了最基础的模型、模型服务、研发工具之外,更重要的是去挖掘和激发各个业务的实践,总结成为流程规范,通过平台化的方式来形成复制。如果实践成熟,会形成指南,如果公司对于指南的做法形成更为统一的看法,会做成规范。也就是通过实践+规范指南+工具平台,这一套组合,支撑和促进了公司内AI原生开发的大幅增长,以及效率的提升。从年初到现在,我们的应用数增加了76%,现在这类应用能占到公司整体应用的10%以上,超过50%的工程师开发过Prompt,在数据飞轮和数据流程上也实现了50%的提效。

臧志在阐释了AI原生研发新范式的具体内涵之后,也分享了百度在AI赋能研发领域的探索和实践经验。

AI赋能研发的领域最近非常热,行业大致会按照AI辅助的贡献来分为五个阶段。在一家企业落地,不是简单的一个阶段,而是复杂任务的组合,因此前面提到的几个阶段,会同时存在,共同推进。总结起来,这由两个要素来决定:一个是任务的复杂度,这包括任务的粒度有大有小,是否跟其他的代码库或系统有耦合。另一个因素,是人的参与方式,这包括以人为主到机器为主,更抽象的表达方式等等。

在这个过程中,我们发现研发智能化是所有研发团队的共识。通过智能化首先会提升效率,也会更容易的落地一些先进理念,比如测试左移等主张。每个研发团队也都会在这个共识下,去思考结合他们的研发场景,他们需要的更先进的基础设施是什么。所以,在一个企业的研发智能化落地过程中,如何调动和组织起各个团队的积极性至关重要。

百度在智能编码领域已经探索了两年,文心快码已在公司内部被数万名工程师使用。百度每天生成的代码中,有30%由文心快码生成,整体采纳率达46%,这一提效工具的应用令工程师整体提效达到12%。文心快码的应用不仅提高了研发效率,也显著提升了代码质量。在百度内部实践中,文心快码安全漏洞扫描准确率已超过95%,并有83%的扫描漏洞已被修复闭环。

同时,百度通过文心快码的内外部的实践经验,已经总结出一套标准化的落地流程以及最佳实践,通过实施人机协同原则和构建落地执行体系,促进企业工程文化的转变和数据驱动价值闭环。

除了帮助百度内部数万名工程师提升研发效率和质量之外,文心快码也已应用于吉利汽车、顺丰科技、方正证券、华农保险、喜马拉雅、同程旅行、名创优品、上海三菱电梯等万家企业客户,覆盖汽车、金融、物流、互联网、机械制造、软件服务、集成电路等行业领域。文心快码在企业的落地实践案例,也获得了权威机构的认可,成为行业最佳实践标杆应用


http://www.kler.cn/a/378857.html

相关文章:

  • Hadoop•用Web UI查看Hadoop状态词频统计
  • 非科班转码第5年零241天
  • OpenHarmony 4.1 SDK11 北向应用开发笔记
  • 【17】Word:林楚楠-供应链❗
  • 【逆境中绽放:万字回顾2024我在挑战中突破自我】
  • ZooKeeper 核心知识全解析:架构、角色、节点与应用
  • 双向链表及如何使用GLib的GList实现双向链表
  • b站小土堆PyTorch视频学习笔记(CIFAR10数据集分类实例)
  • javascript 字符串转json格式数组
  • nginx系列--(三)--http
  • L1-2 什么是机器学习
  • 一些python torch函数
  • ROS(Robot Operating System)中,编写一个记录机器人速度并将其转换成轨迹
  • 【jvm】Full GC
  • 网络层3——IP数据报转发的过程
  • 请你谈一谈闭包?详细解释闭包的概念、形成原因、作用及与作用域、垃圾回收机制的关系
  • 深度学习(十):伦理与社会影响的深度剖析(10/10)
  • 最简单方式SSH连接局域网中另一台电脑的WSL2
  • java并发编程-volatile的作用
  • 搜索引擎语法大全(Google、bing、baidu)
  • scala Map集合
  • MySQL45讲 第十二讲 为什么我的MySQL会“抖”一下?
  • 大数据新视界 -- 大数据大厂之提升 Impala 查询效率:索引优化的秘籍大揭秘(上)(3/30)
  • 「iOS」——知乎日报一二周总结
  • STL学习-关联容器-pair数对
  • 新老项目不同node版本,使用nvm控制node版本切换(mac、window)