当前位置：首页 > article >正文

多模态大模型打造沉浸式社交体验，Soul App创始人张璐团队海外首秀GITEX GLOBAL

article 2025/2/22 2:24:12

2024年10月14日至18日,全球科技盛会GITEX GLOBAL在迪拜举办,各大科技企业汇聚一堂,展示前沿技术。在这次大会上,中国社交平台Soul App首次亮相国际大型展会,展示了由Soul App创始人张璐团队研发的多模态AI交互方案,吸引了海外来宾的目光。作为国内较早将AI引入社交关系的社交平台,Soul此次展出的多模态大模型,集成了多模态理解、真实拟人、文字对话、语音通话、多语种等特点,可以带来更自然的人机互动体验。

多模态AI交互方案不仅支持细致的人脸建模,还具备动作捕捉和还原能力,使虚拟人与真人之间的互动更加自然、真实。得益于此,在展会现场,用户可以通过数字设备快速生成专属3D虚拟人,并实现流畅的实时互动。通过多模态的沉浸式体验,Soul不仅展示了其在人工智能和线上社交场景方面的探索成果,也向全球观众呈现了一个多维度的线上社交世界。

自2016年上线以来,Soul便在社交领域不断创新。区别于传统社交模式,Soul始终聚焦用户的个性化表达,坚持以匿名、无压力的社交模式为特点。通过Soul的捏脸系统,用户可以创造自己的虚拟形象,在不强调颜值、地理位置的情况下,自在地分享热爱和兴趣,与志同道合的朋友建立联系。在此背景下,Soul于2022年进一步推出了自研引擎,将AI、渲染和图像处理等技术相结合,帮助用户在虚拟世界中创建富有表现力的3D数字化身,让个体在视觉、听觉、文字等方面展现独特的个性与情绪。基于这些技术积累,目前Soul已经全面升级3D虚拟人功能,集成多模态AI交互方案,以实现更为真实的社交互动体验。

在过去几年中,Soul也在多模态大模型方向持续深耕。2020年,Soul启动AIGC技术研发,专注于智能对话、语音、3D虚拟人等关键能力,并推动这些技术在社交平台的实际应用。目前已经上线了自研语言大模型Soul X,以及语音生成、语音识别、语音对话、音乐生成等大模型能力。到2024年6月,Soul还推出了自研的端到端全双工语音通话大模型。该模型具有超低延迟、丰富情感表达以及快速自动打断等特性,可以使用户的人机对话体验更加贴近现实。

基于自研的AI能力,Soul团队还开发出了“数字分身”内测功能。用户可以根据聊天记录、发帖内容或自定义设置,打造个人数字分身,在平台上实现更智能的互动。“数字分身”在形象、声音、语言风格等多方面高度复刻用户,能够识别并理解用户的行为方式、偏好,从而提供个性化的回复和智能推荐,提高社交互动的效率与质量。此次展出的多模态AI大模型,正是Soul一系列研发成果的综合体现。