当前位置: 首页 > article >正文

GOAT‘S AI早鸟报Part9

资讯

英伟达重磅发布5090,定价15000

老黄重磅发布5090,定价15000!22000元的世界最小AI超级计算机也来了

英伟达在CES发布了最新的GPU——RTX 5090,采用Blackwell架构,具备920亿个晶体管,4000 AI TOPS的AI性能,以及380 RT TFLOPS的光线追踪性能。RTX 5090的售价为1999美元(约14651元),而其他型号如RTX 5080和RTX 5070 Ti分别定价999美元和749美元。此次发布还推出了更新版的NVLink72互联技术,提供1.4 ExaFLOPS的计算能力和超高宽带。此外,英伟达还展示看全球最小的个人超级计算机——Project Digits,具备2000亿参数的大模型,能够在系统上运行并支持云部署,起售价为3000美元。

Project Digits搭载了基于Grace Blackwell架构的GB10超级芯片,结合高效能Grace CPU和最新的Blackwell GPU,为用户提供高性能的AI推理和开发环境。此外,英伟达宣布将开源可商用的世界基础模型——Cosmos,专为自动驾驶和机器人领域的训练而设计,提供了大量基于驾驶和机器人视频数据的训练模型。这些模型支持开发者在物理环境中合成数据,并进行微调。

在其他模型发布方面,英伟达推出了三类模型:Nano、Super和Ultra,适应不同的应用需求,涵盖从低延迟实施部署到高精度定制模型的广泛应用场景。英伟达还推出了NIM微服务和AI蓝图,支持多种开发需求,如数字人类和内容创作。

此次发布的技术和产品表明,英伟达正加速推动AI计算和模型训练的普及,并强调AI将成为各行各业的核心。英伟达股价在发布后创下新高,市值达到3.66万亿美元,稳居全球第二大上市企业,仅次于苹果。

推特

Google AI Studio发布为渐进式网络应用,现在支持在桌面、iOS和Android 设备上本地安装

https://x.com/OfficialLogank/status/1876378894036783614

我们刚刚将Google AI Studio 发布为渐进式网络应用(PWA),现在您可以在桌面、iOS和Android设备上本地安装它。

非常感激,现在我终于不用每天输入20次AI Studio的网址了~~

信号

Large Language Models for Video Surveillance Applications

原文链接:https://arxiv.org/abs/2501.02850v1

ResearchFlow: New Flow - ResearchFlow

视频内容制作的快速增长带来了巨大的数据量,给高效分析和资源管理带来了巨大的挑战。为解决这个问题,强大的视频分析工具必不可少。本文提出了一种创新的概念验证,使用视觉语言模型形式的生成式人工智能(GenAI)来增强下游视频分析过程。我们的工具根据用户自定义的查询生成定制的文本摘要,在广泛的视频数据集中提供有针对性的见解。与提供通用摘要或有限动作识别的传统方式不同,我们的方法利用视觉语言模型来提取相关信息,从而提高分析精度和效率。所提出的方法从大量的闭路电视录像中生成文本摘要,然后可以在与视频相比非常小的存储空间中无限期地存储这些摘要,使用户无需进行详尽的手动审查即可快速导航和验证重要事件。定性评估分别使管道的时间和空间质量以及一致性的准确度达到80%和70%。

产品

AnyParser Pro 功能强大的多语言解析工具

CambioML - AnyParser API: The first LLM for document parsing with accuracy and speed

AnyParser Pro是一款功能强大的多语言解析工具,专为满足现代企业需求而设计它能够高效处理各类文档和图像,包括PDF、Word、PPT和复杂的图片文件,精准提取文本、表格和图表等关键信息。借助先进的AI技术,AnyParser Pro提供卓越的解析精度,无论是复杂格式还是语言内容,都能轻松应对。产品在设计过程中始终将客户隐私置于首位,采用严格的数据保护措施,确保敏感信息的安全性。此外,AnyParser Pro支持无缝企业集成,兼容多种工作流和平台,为用户提供高效、便捷的文档处理体验,帮助企业显著提升工作效率和数据利用能力。

投融资

智平方宣布完成Pre-A轮融资

https://mp.weixin.qq.com/s/NGG2SjnMrKHql4Ps9a-3Tg

智平方近期在具身智能领域取得了重要突破。其国产具身大模型在通用空间感知和泛化操作方面超越了硅谷顶尖模型,推动了中国自主可控的物理世界大模型和机器人技术的发展。智平方的软件产品,如AI2R Brain和Alpha Bot机器人,已经获得了客户的积极认可。这一成绩的背后是强大的资本支持,智平方在2025年初完成了数亿元的Pre-A轮战略融资,由达晨财智和敦鸿资产领投基石资本跟投,标志着具身智能产业化的进一步加速。

智平方由国家级创新人才郭彦东博士创立,郭博士拥有深厚的AI学术背景和产业经验,曾在微软、小鹏汽车和OPPO担任重要职务,主导了多款智能终端的研发。团队成员来自微软、小鹏、OPPO、Momenta等国际知名企业和学术机构,如清华大学和加州伯克利大学,具备强大的技术创新能力和产业化经验。团队结合AI创新与智能终端领域的变革,构建了从原理研发到市场落地的完整闭环能力。

在技术方面,智平方率先突破了空间感知模型的瓶颈,其原创模型结构与增量技术节约了训练成本,并获得了国家级认证。智平方的端到端具身大模型,特别是在RoboMamba和Alpha Bot系列产品中取得了显著进展,尤其在未见任务的泛化能力上超越了国际顶尖企业如Google。智平方的产品如Alpha Bot 1S,在多任务场景中具备高度灵活性和超长续航,成功应用于柔性工业、物料搬运等领域,获得了大量商业订单,成为国内首批进行具身智能商业化的公司之一。

学习

GPU矩阵乘法的性能一致性与异常定位

https://zhuanlan.zhihu.com/p/15886327275

在GPU上,矩阵乘法(GEMM)的实际计算性能通常低于理论性能,这篇文章通过使用MFU(ModelFlops Utilization)来量化实际FLOPS与理论FLOPS的比值,并介绍了一套基于MFU的GEMM性能一致性规则。这些规则帮助自动检测出不同GPU和软件环境下的性能异常,尤其是在矩阵shape、量化策略和版本升级等因素的影响下。文章重点讨论了三种实际中的性能异常案例:RTX4090的float16计算性能下降、A800上某些矩阵shape的计算效率异常低下,以及Marlin量化策略在batch过大时性能不佳。

首先,文章探讨了MFU与矩阵shape的关系,认为在矩阵A的shape大于B时,A的MFU应该与B相当或更高。实验表明,在RTX4090上,部分batch的MFU显著低于预期,且这类异常batch占到总数的35%左右。通过将矩阵拆分为较小的子矩阵进行计算(splitwise GEMM),在某些情况下能显著提高性能。例如,在A800上,拆分矩阵后GEMM的计算时间显著减少。

接着,文章讨论了量化计算的MFU一致性,特别是在int8和int4量化方式下,GPU的性能表现有所不同。对于小batch的int8/int4量化,GPU的性能通常较好,但随着batch增大,性能受限于显存带宽,导致其计算时间与float16接近甚至增加。Marlin作为一种weight-only量化方法,其在小batch下的解码性能加速显著,但在大batch下则表现不如预期,甚至存在40%以上的性能损失。

本期AI产品合集:
AnyParser Pro 功能强大的多语言解析工具

AnyParser Pro是一款功能强大的多语言解析工具,专为满足现代企业需求而设计它能够高效处理各类文档和图像,包括PDF、Word、PPT和复杂的图片文件,精准提取文本、表格和图表等关键信息。借助先进的AI技术,AnyParser Pro提供卓越的解析精度,无论是复杂格式还是语言内容,都能轻松应对。产品在设计过程中始终将客户隐私置于首位,采用严格的数据保护措施,确保敏感信息的安全性。此外,AnyParser Pro支持无缝企业集成,兼容多种工作流和平台,为用户提供高效、便捷的文档处理体验,帮助企业显著提升工作效率和数据利用能力。

Sitelifter AI 驱动的工具 优化网页设计工具

Sitelifter 是一款由 AI驱动的工具,专注于帮助用户优化网站页面的设计、内容信息传递、用户流畅度以及转化率表现。通过深入分析目标受众需求,Sitelifter 提供定制化的可操作建议,帮助用户在网站开发和运营的早期阶段减少错误,避免反复试验所带来的浪费。同时,它通过精准的数据分析和优化方案,使网站性能得到显著提升帮助企业实现更高效的数字化运营,无需依赖经验或猜测即可获得专业结果。


http://www.kler.cn/a/471638.html

相关文章:

  • 大数据架构设计:数据分层治理的全景指南
  • 嵌入式中QT实现文本与线程控制方法
  • C++ 中如何优雅地返回一个递归闭包函数?
  • 【C++面向对象——类的多态性与虚函数】编写教学游戏:认识动物(头歌实践教学平台习题)【合集】
  • 【C语言程序设计——选择结构程序设计】预测你的身高(头歌实践教学平台习题)【合集】
  • git理解记录
  • 2019年IMO第2题
  • 深入解析Java 8中的Lambda表达式与函数式接口
  • MATLAB语言的数据结构
  • 【Javascript Day2】
  • 32单片机从入门到精通之数据处理——传感器接口(十二)
  • kafka搭建
  • 代码随想录day38 动态规划6
  • 06-RabbitMQ基础
  • 【源码+文档+调试讲解】项目申报小程序
  • 一次压测的记录笔记
  • 基于 GEE 的 MODIS 数据集 NDVI 时间序列动画
  • FPGA与IC:选哪个更好?
  • 基于微信小程序疫苗预约系统ssm+论文源码调试讲解
  • 计算机网络之---网络拓扑
  • 教育咨询系统架构与功能分析
  • Android车载音频系统目录
  • pycharm-pyspark 环境安装
  • Koi技术教程-Tauri基础教程-第二节 Tauri的核心概念下
  • 02- 三自由度串联机械臂运动学分析
  • 【MySQL系列文章】Linux环境下安装部署MySQL