当前位置: 首页 > article >正文

MemVerge与美光科技利用CXL®内存提升NVIDIA GPU利用率

该联合解决方案将 GPU 利用率提高了 77%,并将 OPT-66B 批量推理的速度提高了一倍以上。

图片

2023 年 3 月 18 日,作为大内存软件领域领导者的 MemVerge,与美光科技联手推出了一项突破性解决方案,该方案通过智能分层的 CXL 内存,提升了大型语言模型(LLMs)的性能,通过从 GPU HBM 卸载到 CXL 内存。这一创新合作正在 GTC 展会的美光展位 #1030 展出,与会者可以亲身体验分层内存对 AI 工作负载的变革性影响。

MemVerge 首席执行官兼联合创始人 Charles Fan 强调了克服 HBM 容量瓶颈的关键重要性。“以成本效益的方式扩展 LLM 性能意味着要持续为 GPU 提供数据,” Fan 表示。“我们在 GTC 的演示表明,分层内存池不仅能提高性能,还能最大化提升 GPU 资源的利用率。”

由 MemVerge 和美光科技的工程师进行的演示,采用了 FlexGen 高吞吐量生成引擎和 OPT-66B 大型语言模型,运行在配备了 AMD Genoa CPU、Nvidia A10 GPU、美光DDR5-4800 DIMMs、CZ120 CXL 内存模块和 MemVerge Memory Machine™ X 智能分层软件的 Supermicro Petascale 服务器上。

演示的结果令人印象深刻。使用分层内存的 FlexGen 基准测试,完成任务的时间不到传统 NVMe 存储方法的一半。同时,GPU 利用率从 51.8% 飙升至 91.8%,这得益于 MemVerge Memory Machine X 软件在 DIMM 和 CXL 模块间透明管理数据分层的能力。

MemVerge、美光科技和 Supermicro 之间的合作标志着推进 AI 工作负载能力的重要里程碑,使企业能够实现前所未有的性能、效率和洞察力获取速度。通过利用 CXL 内存和智能分层的力量,企业可以解锁创新的新机会,并加速其走向 AI 驱动成功的旅程。

美光科技计算与网络业务部门高级副总裁兼总经理 Raj Narasimhan 表示:“通过与 MemVerge 的合作,美光能够展示 CXL 内存模块对提高 AI 应用有效 GPU 吞吐量的显著提升,美光在内存产品组合上的创新为计算提供了必要的内存容量和带宽,以扩展从云到边缘的 AI 用例。”

关于 MemVerge

MemVerge 是大内存计算软件的开创性开发者。无论是在云中还是本地部署,数据密集型工作负载都能以更快的速度、更低的成本运行,并凭借公司的获奖产品 Memory Machine™ 实现自动恢复。Memory Machine X 有望彻底改变未来 CXL®内存的使用方式,而 Memory Machine Cloud 以其持续优化云成本和性能的能力脱颖而出。了解更多关于 MemVerge 及其 Memory Machine 软件的信息,请访问 www.memverge.com。


http://www.kler.cn/a/415664.html

相关文章:

  • STM32--MAP文件
  • Fantasy业务代码执行之Run方法分析
  • SQLModel入门
  • Android数据存储——文件存储、SharedPreferences、SQLite、Litepal
  • HTML CSS JS基础考试题与答案
  • Mac安装及合规无限使用Beyond Compare
  • 十二、正则表达式、元字符、替换修饰符、手势和对话框插件、字符串截取
  • 面向多用户场景的恢复机制驱动的无线组密钥生成协议
  • LLM: softMax function and temperature
  • 可编程网络在分布式深度学习通信瓶颈控制中的应用与未来展望
  • Android RIL面试题及参考答案
  • 【系统架构设计师】真题论文: 论数据访问层设计技术及其应用(包括解题思路和素材)
  • Ubantu系统非root用户安装docker教程
  • c++ 程序来计算三角形的面积(Program to find area of a triangle)
  • 【Unity-父节点】
  • 点云3DHarris角点检测算法推导
  • TsingtaoAI具身智能高校实训方案通过华为昇腾技术认证
  • C++开源游戏项目OpenTTD(运输大亨)源码的编译和运行
  • 基于Redis内核的热key统计实现方案|得物技术
  • 彻底理解quadtree四叉树、Octree八叉树 —— 点云的空间划分的标准做法
  • Vue.js 指令详解:v-bind, v-html, v-once, v-on, v-if, v-else-if, v-else 和 v-model
  • 音视频入门基础:MPEG2-TS专题(9)——FFmpeg源码中,解码TS Header的实现
  • wareshark分析mysql协议的数据包
  • 【Jenkins】docker 部署 Jenkins 踩坑笔记
  • 微信小程序:实现定时拍照与自动上传功能攻略——静音版
  • 【C++】深入探讨基础输入输出及类型转换问题