当前位置: 首页 > article >正文

AI大模型日报#0923:李飞飞创业之后首个专访、华为云+腾讯音乐发布昇腾适配方案

导读:AI大模型日报,爬虫+LLM自动生成,一文览尽每日AI大模型要点资讯!

目前采用“文心一言”(ERNIE-4.0-8K-latest)、“智谱AI”(glm-4-0520)生成了今日要点以及每条资讯的摘要。欢迎阅读!

《AI大模型日报》今日要点:近日,AI大模型领域迎来多项重要进展。华为云与腾讯音乐天琴实验室达成深度合作,共同推出基于昇腾AI的视觉大模型推理加速方案,显著提升了推理速度与性价比,为大模型部署提供了高效经济的解决方案。美图公司则宣布其美图奇想大模型视频生成能力全面升级,生成效率与模型性能均实现进阶,优化了多领域风格泛化力。同时,李飞飞教授的空间智能创业公司World Labs正式亮相,她强调了空间智能在AI领域的重要性,并探讨了AI的终极目标。 此外,上海AI Lab推出新一代视频生成大模型“书生・筑梦2.0”,支持长视频多格式生成及2K分辨率增强,并开源了训练框架LiteGen。在AI大模型的数学推理能力评测方面,北大与阿里巴巴联合打造的Omni-MATH评测基准显示,o1-mini模型表现最佳,验证了关注少部分能力、放弃广泛世界知识路线的优势。 随着基础模型时代的来临,移动机器人的智能化也取得突破。研究者们期待将基础模型应用于移动机器人,提升其场景感知和任务执行能力,有望在未来展现更强的自主性和灵活性。这些进展共同推动了AI大模型领域的发展,为各行业数智化升级提供了有力支持。

标题: 华为云+腾讯音乐天琴实验室达成深度合作,基于昇腾AI


摘要: 9月19-21日,华为全联接大会在上海举办。腾讯音乐娱乐集团天琴实验室与华为云昇腾AI云服务合作,发布了视觉大模型推理加速方案lyraSD的昇腾适配方案。该方案采用多项优化策略,相比传统方案推理速度提升166%,性价比提升35%,降低了大模型部署门槛,提供了高效、经济的AI算力应用解决方案。此外,天琴实验室MUSELight将在昇腾AI算力的加速下,展开歌单封面生成业务试点,推进音乐制作产业数智化升级。双方还将推出更多大模型推理加速解决方案,全面赋能各项业务形态。
网址: 华为云+腾讯音乐天琴实验室达成深度合作,基于昇腾AI | 机器之心
 
标题: 美图奇想大模型全新升级:生成能力、生成效率、模型性能实现三重进阶


摘要: 9月23日,美图公司宣布美图奇想大模型(MiracleVision)视频生成能力全面升级,结合多项自研技术优势,显著提升视频生成时长、画质等。该模型支持长视频生成,并在艺术风格、细节把控上达到高度平衡,优化多领域风格泛化力。升级后的模型采用新技术路线,解决了视频生成核心问题,已应用于美图旗下部分产品,将提升用户体验与效率,并深化在多个领域的应用实践。
网址: 美图奇想大模型全新升级:生成能力、生成效率、模型性能实现三重进阶 | 机器之心
 
标题: 李飞飞创业之后首个专访:视觉空间智能与语言一样根本


摘要: 李飞飞教授的空间智能创业公司World Labs及其全明星团队正式亮相,随后她与联合创始人Justin Johnson接受了a16z的专访。在访谈中,李飞飞重点介绍了AI领域的新研究前沿——空间智能,认为其与语言一样根本。她回顾了自己在AI领域20多年的经历,以及ImageNet对计算机视觉发展的贡献,强调了计算和数据在AI发展中的重要作用。同时,她定义了AI的终极目标,并探讨了空间智能在其中所扮演的角色。最后,她介绍了World Labs团队及度量空间智能发展进展的方式。访谈还涉及了AI的发展历程、生成式AI与预测建模的区别等话题。
网址: 李飞飞创业之后首个专访:视觉空间智能与语言一样根本 | 机器之心
 
标题: 开源!上海AI Lab视频生成大模型书生·筑梦 2.0来了
摘要: 机器之心AIxiv专栏促进了全球学术交流,现推出上海人工智能实验室的新一代视频生成大模型“书生・筑梦2.0”,支持长视频、多格式生成和2K分辨率增强。该模型采用扩散式Transformer架构,并开源训练框架LiteGen,优化显存和序列长度,提升视频生成效率。团队由上海人工智能实验室和新加坡南洋理工大学S-Lab成员组成,致力于视频生成技术的前沿研究,包括VBench、VideoBooth等多个项目进展。
网址: 开源!上海AI Lab视频生成大模型书生·筑梦 2.0来了 | 机器之心
 
标题: 北大AI奥数评测,o1-mini比o1-preview分数还高
 


摘要: 北大与阿里巴巴的研究团队联合打造了一个数学奥林匹克评测基准——Omni-MATH,用于评估大型语言模型在奥林匹克水平的数学推理能力。该评测集包含4428道竞赛级别的问题,涵盖33个子领域和10个难度级别。在最新排行榜中,o1-mini表现最佳,平均分比o1-preview高8%,验证了关注少部分能力、放弃广泛世界知识路线的优势。此外,Omni-MATH具有人工验证答案的可靠性、清晰合理的难度分类和广泛的题目类型等特点。研究团队对国内外奥林匹克数学竞赛进行了调研,构建了树状分类体系,并利用GPT-4o给每道题目分类。同时,还开发了一个开源的答案验证器Omni-Judge,用于验证模型的输出是否和标准答案一致,评测一致率高达95%。
网址: 北大AI奥数评测,o1-mini比o1-preview分数还高 | 量子位
 
标题: 秋分 | 基础模型时代下的移动机器人
摘要: 1966年,斯坦福大学SRI研究所开发的Shakey是第一个具备感知、规划和执行能力的自主移动机器人,但受限于当时的技术和计算能力,其应用有限。随着硬件、计算和算法的发展,移动机器人已走向实际应用。研究者期待将基础模型应用于移动机器人,提升场景感知和任务执行能力。一种稳健的研究思路是扩展基于地图的技术路线,利用先进传感器和SLAM算法构建高质量地图,结合基础模型进行场景理解和任务执行。同时,探索将信息与大语言模型结合,处理更复杂指令任务。另一种新颖做法是端到端移动机器人算法,直接通过大模型处理传感器数据并执行动作,避免繁琐规则设计,但面临数据挑战。尽管存在诸多问题,基础模型的结合仍为移动机器人带来智能化突破,有望在未来展现更强自主性和灵活性。
网址: 秋分 | 基础模型时代下的移动机器人 - 智源社区
 


http://www.kler.cn/a/317138.html

相关文章:

  • 【AI构思渲染】网络直播——建筑绘图大模型生成渲染图
  • llama factory lora 微调 qwen2.5 7B Instruct模型
  • Linux源码阅读笔记-V4L2框架基础介绍
  • Python 随笔
  • Python数据类型(一):bool布尔类型
  • 微擎框架php7.4使用phpexcel导出数据报错修复
  • 基于MaxScale搭建MariaDB读写分离集群的方法【2024年最新版】
  • 深度学习(一)——CMC特刊推荐
  • 统一网关--gateway(仅供自己参考)
  • 深入探究PR:那些被忽视却超实用的视频剪辑工具
  • ES解说!
  • 【重学 MySQL】三十七、聚合函数
  • 【第十二章:Sentosa_DSML社区版-机器学习之回归】
  • expressjs 和 Router 配置 POST 请求
  • 智能算法躲避拥堵,高德企业用车上线“动态选路服务”为出行提效
  • Redis常用数据类型
  • 自动化测试常用函数
  • 数据结构 ——— 算法的空间复杂度
  • 使用 HFD 加快 Hugging Face 模型和数据集的下载,解决443报错
  • 逗号运算符
  • git报错:无法读取远程分支 ‘origin‘ does not appear to be a git repository
  • MySQL—多表操作详解
  • 【CSS in Depth 2 精译_038】6.2 CSS 定位技术之:绝对定位
  • 使用SBP打AssetBundle时脚本引用丢失
  • [Linux]ubuntu安装nvidia显卡驱动登录后黑屏
  • 通过 Flink 的火焰图定位反压