当前位置: 首页 > article >正文

Soul App创始人张璐团队自研多模态大模型,亮相GITEX GLOBAL获好评

2024年10月14日至18日,全球科技盛会GITEX GLOBAL海湾信息技术博览会于迪拜如期举行。作为全球三大IT展之一,该展会汇聚了世界各地的科技巨头、创新初创公司和专业投资者,旨在展示国际上最前沿的科技成果。今年的展会规模再度升级,吸引了超过6700家企业参展,涵盖人工智能、数字娱乐、社交、健康等多个领域。此次展会,新型社交平台Soul App创始人张璐团队展示了其自研的集成3D虚拟人能力的多模态AI交互方案,吸引了广泛关注。

Soul此次参展的多模态大模型集成了3D虚拟人的创新能力,标志着其在社交场景中技术积累的又一重要突破。该AI交互方案具备文字、语音、动作等多种信息的交互特性,为用户提供了自然、沉浸式的互动体验。在现场的观众可以通过对应装置,即时生成3D虚拟数字分身,体验到基于实时动作捕捉与还原技术的高度拟人化互动。

实际上,Soul的技术突破并非一朝一夕。自2016年上线以来,Soul便致力于为用户打造轻松自在的社交环境。为了降低用户的社交压力,Soul从一开始便不支持上传真实头像,而是通过捏脸系统让用户自定义个性化虚拟形象。随着AI技术的发展,Soul逐步集成了图像处理和渲染技术,使得用户能够创建更生动的3D虚拟形象和场景。在此基础上,Soul不断提升虚拟人与真人之间的互动效果,通过多模态大模型实现了更丰富维度的信息传递和更加接近人类模式的社交体验。

值得一提的是,Soul的多模态大模型不仅仅局限于3D虚拟人交互。自2020年起,Soul加大了对AIGC技术的研发,先后推出了语言大模型、语音生成大模型等,并在今年6月率先推出了端到端全双工语音通话大模型。此模型就已经可以实现超低交互延迟、快速自动打断等功能。简单来说,这些技术使得Soul在语音交互、情感表达、声音生成等方面取得了显著的进展,为用户提供了更加拟人化的情感陪伴体验。此次展示的多模态端到端大模型整合了语言、文字、视觉等多种模态,进一步提升了人机交互的自然性和多样性。

在GITEX GLOBAL上,Soul的技术展示吸引了大量参展者的关注。参观者可以通过体验Soul平台的3D虚拟人功能,感受到虚拟人与真人之间的情感交互,甚至可以通过该平台打造专属于自己的“数字分身”。这种技术不仅可以帮助用户在虚拟世界中塑造独特的社交形象,还能通过智能推荐、个性化回复等方式,提升社交破冰和人际沟通的效率;用视觉算法复刻用户行为动作,辅助用户进行更有趣的社交表达。

通过参加此次GITEX GLOBAL大会,Soul App创始人张璐团队展示了其在社交领域的技术积累和创新应用。凭借多模态AI交互方案和集成3D虚拟人能力,Soul为用户带来了全新的社交体验。此次参展也为Soul提供了与海内外创新企业交流的机会,让世界看到了中国企业在社交领域的最新应用实践和数字娱乐的创新方案。


http://www.kler.cn/a/380459.html

相关文章:

  • Vue3版本的uniapp项目运行至鸿蒙系统
  • Golang | Leetcode Golang题解之第524题通过删除字母匹配到字典里最长单词
  • opencv python笔记
  • IMU应用于监测进食
  • 上市公司环境信息披露质量评分数据王婉菁版(2008-2023年)噪声光污染辐射废水减排等治理
  • C++ 内存对齐:alignas 与 alignof
  • 【Arch Linux 上安装 Appium 】
  • 进程介绍!
  • AcWing 1073 树的中心 树形dp (详解)
  • 图书管理系统(JDBC)
  • Elasticsearch Date类型,时间存储相关说明
  • 创新材料科技:铜冷却壁助力高炉节能降耗
  • 【React】初学React
  • 新能源汽车火灾应急处置程序
  • w~大模型~合集20
  • 在 Oracle 数据库中,SERVICE_NAME 和 SERVICE_NAMES 有什么区别?
  • 云原生后端:现代应用程序开发的关键技术
  • 【vue项目中添加告警音频提示音】
  • 如何编写STM32的RTC程序
  • 自动化立体仓库:详细设计方案
  • 深度学习之数据增强
  • DDOS的攻击方式有哪些?
  • 音视频入门基础:H.264专题(22)——通过FFprobe显示H.264裸流每个packet的信息
  • 内网远程连接解决方案【Frp】
  • C# 程序暂停的两种方式
  • 11.4OpenCV_图像预处理02