当前位置: 首页 > article >正文

AI硬件系统(一):计算范式

目前看到的几种关键加速计算范式包括 Cube、脉动和空间计算

文章目录

  • cube
  • 脉动
  • 空间计算

cube

  • 顾名思义完成立方体计算。其实质来自于对高维 tensor的拆分执行,对立方体进行取截面或者取部分块实现密集计算的方案
  • 此类方法优势在于直观好理解,实现简洁
  • 不足在于,一方面会受限与硬件可实现的规模(主要是数据广播和时延控制);另一方面软件编程接口的粒度被严重锁死,灵活性差

脉动

  • 主要通过对数据的分区域复用实现对计算规模的渐次增加。完全并行后计算规模可以做的更大
  • 不足在于计算时延会被拉长

空间计算

  • 可以理解为对脉动或者cube的空间展开。主要做很对更大规模的AI加速方案,例如celebras。或者众核的设计思路
  • 逻辑在于通过多个小计算核对任务进行空间展开实现。并实现空间流水
  • 优势在于流水起来之后可以实现近似硬件的PP并行,由于在单个芯片或者die内,所以有效地控制了写出芯片的带宽问题

http://www.kler.cn/a/583744.html

相关文章:

  • Spring Boot Tomcat 漏洞修复
  • GOF设计模式在 Spring 框架中的核心应用分析
  • 13. Pandas :使用 to_excel 方法写入 Excel文件
  • 【Repos系列】Bandersnatch同步原理
  • 计算机网络基础:探秘网络数据传输
  • C# NX二次开发:拉伸UFUN函数避坑指南
  • 压缩空气储能仿真simulink模型
  • 【高并发内存池】细节处理 + 性能优化 + 总结
  • 机器视觉工程师红外相机的选择:红外长波工业相机和短波红外工业相机玄机大总结
  • 力扣第585题
  • 51. HarmonyOS NEXT 登录模块开发教程(五):安全性考虑与最佳实践
  • Netty基础—基础网络协议
  • 深度学习模型试跑(十九):depth-anything-tensorrt(c++,vs2022版,点云)
  • npm学习
  • 1N4148数据手册:小信号二极管全面解析
  • 专访数势科技谭李:智能分析 Agent 打通数据平权的最后一公里
  • 介绍C++vector的insert函数用法
  • Mybatis3 调用存储过程
  • 【HarmonyOS Next之旅】DevEco Studio使用指南(三)
  • 二维数组基础