AI大模型日报#0923:李飞飞创业之后首个专访、华为云+腾讯音乐发布昇腾适配方案
导读:AI大模型日报,爬虫+LLM自动生成,一文览尽每日AI大模型要点资讯!
目前采用“文心一言”(ERNIE-4.0-8K-latest)、“智谱AI”(glm-4-0520)生成了今日要点以及每条资讯的摘要。欢迎阅读!
《AI大模型日报》今日要点:近日,AI大模型领域迎来多项重要进展。华为云与腾讯音乐天琴实验室达成深度合作,共同推出基于昇腾AI的视觉大模型推理加速方案,显著提升了推理速度与性价比,为大模型部署提供了高效经济的解决方案。美图公司则宣布其美图奇想大模型视频生成能力全面升级,生成效率与模型性能均实现进阶,优化了多领域风格泛化力。同时,李飞飞教授的空间智能创业公司World Labs正式亮相,她强调了空间智能在AI领域的重要性,并探讨了AI的终极目标。 此外,上海AI Lab推出新一代视频生成大模型“书生・筑梦2.0”,支持长视频多格式生成及2K分辨率增强,并开源了训练框架LiteGen。在AI大模型的数学推理能力评测方面,北大与阿里巴巴联合打造的Omni-MATH评测基准显示,o1-mini模型表现最佳,验证了关注少部分能力、放弃广泛世界知识路线的优势。 随着基础模型时代的来临,移动机器人的智能化也取得突破。研究者们期待将基础模型应用于移动机器人,提升其场景感知和任务执行能力,有望在未来展现更强的自主性和灵活性。这些进展共同推动了AI大模型领域的发展,为各行业数智化升级提供了有力支持。
标题: 华为云+腾讯音乐天琴实验室达成深度合作,基于昇腾AI
摘要: 9月19-21日,华为全联接大会在上海举办。腾讯音乐娱乐集团天琴实验室与华为云昇腾AI云服务合作,发布了视觉大模型推理加速方案lyraSD的昇腾适配方案。该方案采用多项优化策略,相比传统方案推理速度提升166%,性价比提升35%,降低了大模型部署门槛,提供了高效、经济的AI算力应用解决方案。此外,天琴实验室MUSELight将在昇腾AI算力的加速下,展开歌单封面生成业务试点,推进音乐制作产业数智化升级。双方还将推出更多大模型推理加速解决方案,全面赋能各项业务形态。
网址: 华为云+腾讯音乐天琴实验室达成深度合作,基于昇腾AI | 机器之心
标题: 美图奇想大模型全新升级:生成能力、生成效率、模型性能实现三重进阶
摘要: 9月23日,美图公司宣布美图奇想大模型(MiracleVision)视频生成能力全面升级,结合多项自研技术优势,显著提升视频生成时长、画质等。该模型支持长视频生成,并在艺术风格、细节把控上达到高度平衡,优化多领域风格泛化力。升级后的模型采用新技术路线,解决了视频生成核心问题,已应用于美图旗下部分产品,将提升用户体验与效率,并深化在多个领域的应用实践。
网址: 美图奇想大模型全新升级:生成能力、生成效率、模型性能实现三重进阶 | 机器之心
标题: 李飞飞创业之后首个专访:视觉空间智能与语言一样根本
摘要: 李飞飞教授的空间智能创业公司World Labs及其全明星团队正式亮相,随后她与联合创始人Justin Johnson接受了a16z的专访。在访谈中,李飞飞重点介绍了AI领域的新研究前沿——空间智能,认为其与语言一样根本。她回顾了自己在AI领域20多年的经历,以及ImageNet对计算机视觉发展的贡献,强调了计算和数据在AI发展中的重要作用。同时,她定义了AI的终极目标,并探讨了空间智能在其中所扮演的角色。最后,她介绍了World Labs团队及度量空间智能发展进展的方式。访谈还涉及了AI的发展历程、生成式AI与预测建模的区别等话题。
网址: 李飞飞创业之后首个专访:视觉空间智能与语言一样根本 | 机器之心
标题: 开源!上海AI Lab视频生成大模型书生·筑梦 2.0来了
摘要: 机器之心AIxiv专栏促进了全球学术交流,现推出上海人工智能实验室的新一代视频生成大模型“书生・筑梦2.0”,支持长视频、多格式生成和2K分辨率增强。该模型采用扩散式Transformer架构,并开源训练框架LiteGen,优化显存和序列长度,提升视频生成效率。团队由上海人工智能实验室和新加坡南洋理工大学S-Lab成员组成,致力于视频生成技术的前沿研究,包括VBench、VideoBooth等多个项目进展。
网址: 开源!上海AI Lab视频生成大模型书生·筑梦 2.0来了 | 机器之心
标题: 北大AI奥数评测,o1-mini比o1-preview分数还高
摘要: 北大与阿里巴巴的研究团队联合打造了一个数学奥林匹克评测基准——Omni-MATH,用于评估大型语言模型在奥林匹克水平的数学推理能力。该评测集包含4428道竞赛级别的问题,涵盖33个子领域和10个难度级别。在最新排行榜中,o1-mini表现最佳,平均分比o1-preview高8%,验证了关注少部分能力、放弃广泛世界知识路线的优势。此外,Omni-MATH具有人工验证答案的可靠性、清晰合理的难度分类和广泛的题目类型等特点。研究团队对国内外奥林匹克数学竞赛进行了调研,构建了树状分类体系,并利用GPT-4o给每道题目分类。同时,还开发了一个开源的答案验证器Omni-Judge,用于验证模型的输出是否和标准答案一致,评测一致率高达95%。
网址: 北大AI奥数评测,o1-mini比o1-preview分数还高 | 量子位
标题: 秋分 | 基础模型时代下的移动机器人
摘要: 1966年,斯坦福大学SRI研究所开发的Shakey是第一个具备感知、规划和执行能力的自主移动机器人,但受限于当时的技术和计算能力,其应用有限。随着硬件、计算和算法的发展,移动机器人已走向实际应用。研究者期待将基础模型应用于移动机器人,提升场景感知和任务执行能力。一种稳健的研究思路是扩展基于地图的技术路线,利用先进传感器和SLAM算法构建高质量地图,结合基础模型进行场景理解和任务执行。同时,探索将信息与大语言模型结合,处理更复杂指令任务。另一种新颖做法是端到端移动机器人算法,直接通过大模型处理传感器数据并执行动作,避免繁琐规则设计,但面临数据挑战。尽管存在诸多问题,基础模型的结合仍为移动机器人带来智能化突破,有望在未来展现更强自主性和灵活性。
网址: 秋分 | 基础模型时代下的移动机器人 - 智源社区