阿里重磅模型深夜开源;DeepSeek宣布开源DeepGEMM;微软开源多模态AI Agent基础模型Magma...|网易数智日报
阿里重磅模型深夜开源:表现超越Sora、Pika,消费级显卡就能跑
2月26日,25日深夜阿里云视频生成大模型万相2.1(Wan)正式宣布开源,此次开源采用Apache2.0协议,14B和1.3B两个参数规格的全部推理代码和权重全部开源,同时支持文生视频和图生视频任务。
据阿里云官方介绍,14B版本万相模型在指令遵循、复杂运动生成、物理建模、文字视频生成等方面表现突出,在权威评测集Vbench中,万相2.1以总分86.22%大幅超越Sora(OpenAI旗下)、Luma、Pika等国内外模型,稳居榜首位置。
DeepSeek宣布开源DeepGEMM,加速R2人工智能模型,重新开放API服务充值
2月26日,DeepSeek宣布开源DeepGEMM。2月25日,DeepSeek API开放平台显示,DeepSeek已重新开放API服务充值。deepseek-chat模型优惠期结束,调用价格已变更为每百万输入tokens 2元,每百万输出tokens 8元。本月上旬,DeepSeek因服务器资源紧张,暂停API服务充值。
目前DeepSeek正在加速推出其R2人工智能模型,该公司最初计划在五月推出,但目前正在努力尽快推出。
治理电视“套娃”收费和操作复杂工作总结部署会在京召开
会议强调,一是加快新型三模通用遥控器和插入式微型机顶盒千万级规模部署。年内完成1130万台批量部署总体目标。推动存量电视机和普通机顶盒适配三模通用遥控器,持续优化手机遥控功能,继续改进提升存量遥控器、机顶盒。二是加快机顶盒内置化电视机试点应用和规模部署。2025年要实现百万级一体化电视机部署目标。三是全面拓展提升酒店、养老机构、医院、培训中心等公共场景电视服务。加强酒店电视治理效果常态化核查工作,出台酒店电视服务技术规范,全面推进酒店电视以旧换新。推动更多养老机构实现“开机看直播、便捷看电视”。深入调研摸底,优化医院、培训中心等场景看电视体验,推动农村等地区提升“双治理”成效。
微软开源多模态AI Agent基础模型Magma
当地时间2月25日,微软在官网开源多模态AI Agent基础模型Magma。据介绍,与传统Agent相比,Magma具备跨数字、物理世界的多模态能力,能自动处理图像、视频、文本等不同类型数据,此外,Magma还能内置了心理预测功能,增强了对未来视频帧中时空动态的理解能力,能够准确推测视频中人物或物体的意图和未来行为。
干货内容,欢迎来✉!
《网易数智年度技术精选合集》
《泛娱乐出海白皮书》
《全球即时通讯(IM)PaaS市场洞察白皮书》
前来讨论更多,戳名片👇👇