当前位置: 首页 > article >正文

商汤科技推出“日日新SenseNova”,大模型体系赋能人工智能新未来

       2023年4月10日,商汤科技SenseTime技术交流日活动在上海举行,分享了以“大模型+大算力”推进AGI(通用人工智能)发展的战略布局,并公布了商汤在该战略下的“日日新SenseNova”大模型体系。

       公开信息显示,商汤科技是我国人工智能软件领域的头部公司,目前已在港股上市,其以“坚持原创,让AI引领人类进步”为使命,旨在持续引领人工智能前沿研究,持续打造更具拓展性更普惠的人工智能软件平台。

       此次活动中,商汤推出的“日日新SenseNova”大模型体系实现了自然语言处理、内容生成、自动化数据标注、自定义模型训练等多种大模型及能力。

       此外,商汤还展示了AI文生图创作、2D/3D数字人生成、大场景/小物体生成等一系列生成式AI模型及应用,并公布了商汤依托AI大装置SenseCore实现“大模型+大算力”融合创新的研发体系。

       商汤科技董事长兼CEO徐立表示:“在AI大模型时代,数据、算法和算力这三要素也在经历新的演变,大模型参数量将以指数级的速率提升,而数据量随着多模态的引入也将大规模增长,因此就必然会导致对算力需求的剧增。我们以AI大装置SenseCore打造AGI时代的基础设施,并基于此将大模型体系命名为‘日日新SenseNova’,寓意‘苟日新、日日新、又日新’,希望在模型的迭代速度及处理问题的能力上可以日日更新,不断解锁AGI的更多可能。”

       目前,商汤历时五年,建设了业界领先的AI大装置,能够输出5.0 exaFLOPS的总算力,是亚洲目前最大的智能计算平台之一。

       基于大装置的能力,商汤构建了计算机视觉、自然语言处理、AI内容生成、多模态、决策智能等多个领域的大模型,持续演进能力并广泛支持各种应用。

       在自身业务上,“日日新SenseNova”也已带来了诸多突破。比如在智能驾驶领域,基于视觉大模型,商汤实现了可识别3000类物体的BEV环视通用感知算法的实车量产,也构建了感知决策一体化的自动驾驶多模态模型,带来更强的环境、行为、动机解码能力。

       商汤将持续推进“日日新SenseNova”大模型体系的建设。“苟日新、日日新、又日新”,商汤大模型研发期待在数据量上、参数结构上、以及能处理的问题上,可以日复一日的提高,携手行业生态共同迎来更强大的AGI技术的突破,让AI技术惠及每个人。

  继百度、360、华为等巨头介绍各自AI大模型后,4月10日商汤科技在技术交流日活动上,公布了在该战略下的“日日新SenseNova”大模型体系和语言大模型“商量SenseChat”,以及依托AI大装置SenseCore实现“大模型+大算力”融合创新的研发体系。另外,商汤表示向行业开发人员开放大量预训练模型及AI开发工具链,赋能客户提升开发效率。

  商汤科技董事长兼CEO徐立表示:“在AI大模型时代,数据、算法和算力这三要素也在经历新的演变,大模型参数量将以指数级的速率提升,而数据量随着多模态的引入也将大规模增长,因此就必然会导致对算力需求的剧增。”

  商汤以AI大装置SenseCore打造AGI(通用人工智能)时代的基础设施,并基于此将大模型体系命名为“日日新SenseNova”,希望在模型的迭代速度及处理问题的能力上可以日日更新,不断解锁AGI的更多可能。

  据介绍,商汤历时五年,建设了业界领先的AI大装置,大装置上总共有2.7万块的GPU芯片卡,可以输出5.0 exaFLOPS的总算力,是亚洲目前最大的智能计算平台之一。基于大装置的能力,商汤目前已构建了计算机视觉、自然语言处理、AI内容生成、多模态、决策智能等多个领域的大模型,持续演进能力并广泛支持各种应用。

  商汤科技联合创始人、首席科学家王晓刚表示,AGI催生了新的研究范式,即基于一个强大的多模态基模型,通过强化学习和人类反馈不断解锁基模型新的能力,从而更高效地解决海量的开放式任务。AGI将实现从‘数据飞轮’到‘智慧飞轮’的演进,最终迈向人机共智。

  据介绍,商汤已建立了全栈的大模型研发体系,并已在多个行业场景中落地,场景的多样性。

  比如,“日日新SenseNova”可以为政企客户提供了多种API接口和服务,包括图片生成,自然语言生成,视觉感知通用任务与标注服务。客户可根据实际应用需求,调用“日日新SenseNova”大模型的各项AI技术能力,低门槛、低成本、高效率地实现各类AI应用。

  在智能驾驶领域,基于视觉大模型,商汤实现了可识别3000类物体的BEV环视通用感知算法的实车量产,也构建了感知决策一体化的自动驾驶多模态模型,带来更强的环境、行为、动机解码能力。

  “日日新SenseNova”也推出了商汤最新研发的语言大模型“商量SenseChat”。作为千亿级参数的自然语言处理模型,“商量SenseChat”使用大量数据训练,并充分考虑了中文语境,能够更好地理解和处理中文文本。

  活动现场,“商量SenseChat”展示了出色的多轮对话和超长文本的理解能力。商汤也展示了语言大模型支持的几项创新应用,包括:编程助手,可帮助开发者更高效地编写和调试代码;健康咨询助手,为用户提供个性化的医疗建议;PDF文件阅读助手,能轻松从复杂文档中提取和概括信息。

  基于AI大装置SenseCore和“日日新SenseNova”大模型体系,商汤面向行业伙伴提供涵盖自动化数据标注、自定义大模型训练、模型增量训练、模型推理部署、开发效率提升等多种大模型即服务(Model-as-a-Service)。

  其中,预训练大模型的自动化数据标注可实现相较于人工数据标注近百倍的效率提升;大模型并行训练和模型增量训练服务能够帮助客户快速利用自有数据训练模型。另外,模型推理部署服务可将大模型推理效率提高100%以上,降低用模型提供服务的成本。商汤也向行业开发人员开放大量预训练模型及AI开发工具链,赋能客户提升开发效率。

  截至4月10日收盘,商汤-W(00020.HK)股价上涨2.15%,报收3.33港元/股。


http://www.kler.cn/news/9672.html

相关文章:

  • Elasticsearch:ESQL 简介 — 一种用于灵活、迭代分析的新查询语言
  • 使用模板窗口生成测试数据
  • TypeScript由浅到深(上篇)
  • 工程管理系统软件 自主研发,工程行业适用
  • 【国内chatgpt最全使用方法合集】(总有一个适合你)
  • GaussDB行存储表列存储表相关
  • 本地安装WSL的发行版后,导出到另一台计算机安装的办法
  • 自然语言处理(七): Deep Learning for NLP: Recurrent Networks
  • Python第三方库安装
  • 人脑体内扩散张量分布MRI的新框架
  • Diffusion模型系列文章
  • midjourney注册教程
  • 浏览器表单自动填充调研
  • 企业资源规划(ERP)监控工具
  • Python 进阶指南(编程轻松进阶):一、处理错误和寻求帮助
  • AttributeError: ‘HowNetDict‘ object has no attribute ‘en_map‘ 解决方法
  • 医疗耗材缺陷视觉检测的应用
  • 进步电机和伺服电机
  • 肖 sir_就业课__009接口测试和接口自动化讲解
  • Linux Redis主从复制 | 哨兵监控模式 | 集群搭建 | 超详细
  • vue移动端实现vue-pdf在线预览与展示,并且解决页面汉字空白的问题
  • 创建型模式-单例(Singleton)-解决访问创建对象的问题
  • 使用开发者工具等跳过付费墙
  • ffmpeg的滤镜
  • Python-代码阅读-epsilon-greedy策略函数
  • Spark大数据处理讲课笔记3.1 掌握RDD的创建
  • Leetcode.1019 链表中的下一个更大节点
  • HTTP协议详解(二)
  • 第五十五天打卡
  • Sentinel滑动时间窗限流算法原理及源码解析(下)