当前位置: 首页 > article >正文

文献阅读(207)FPGA HBM

  • 题目:HBM Connect: High-Performance HLS Interconnect for FPGA HBM
  • 时间:2021
  • 会议:FPGA
  • 研究机构:UCLA Jason Cong

  • 题目:Demystifying the Memory System of Modern Datacenter FPGAs for Software Programmers through Microbenchmarking
  • 时间:2021
  • 会议:FPGA
  • 研究机构:加拿大西蒙菲莎大学

FPGA中的HBM主要是为了解决带宽受限的问题,这里的两篇论文都是针对存储和互连的优化,希望能最大化HBM的带宽。需要解决两个事情:

  • memory port的数量、位宽、burst_len等一些列参数的确定,避免小马拉大车
  • 如何充分的利用多个独立的HBM通道,需要互连的优化

所以第一篇论文的主要贡献点在于:

  • 通过设计的switching和crossbar结构提高throughput
  • A BRAM-efficient HLS buffering scheme that increases the AXI burst length and the effective bandwidth when PEs access several HBM pseudo channel

在这里插入图片描述

相比于第一篇论文,第二篇论文更简单些,主要是针对不同参数进行一系列对比实验,一些有意义的结论包括:

  • 总有效片外存储器带宽几乎与所有并发存储器访问端口的合计端口宽度成线性比例关系。对于理论峰值带宽为19.2GB/s的单个DDR4存储体,其在512位变得平坦:有效峰值读写带宽约为18.01GB/s和16.56GB/s。对于理论峰值带宽为14.4GB/s的单个HBM2存储体,其在512位也变得平坦:多个存储器端口访问单个DRAM存储体的有效峰值读写带宽约为13.18GB/s和13.17 GB/s。
  • 每个端口的最大突发访问大小(即每个端口的数据宽度和最大突发访问长度的乘积)应设置为16Kb(即2KB)。 然而,单端口接入没有这个要求。对于HBM,通常每个存储器访问端口连接到一个单独的HBM bank
  • 有效片外存储器带宽随着连续数据访问大小的增加而增加,当该大小在128KB左右时变得平坦。
  • 对于加速器到加速器的流端口,总(片内)通信带宽与每个端口的数据宽度(每个端口最高1024位)和端口数量(16个端口时持平)成线性比例关系。
  • 在设计中,应通过联合考虑计算-内存平衡和资源利用来选择最佳配置,而不是综合选择峰值带宽配置。

在这里插入图片描述


http://www.kler.cn/a/104540.html

相关文章:

  • Fedora Linux 38下安装音频与视频的解码器和播放器
  • 第八章 软件测试自动化
  • python 动态加载C# 动态库的一些问题
  • css3 3D 转换 技巧详细解析与代码实例
  • Java连接redis报错timed out问题解决
  • linux安装gitlab-runner最新保姆级教程
  • 大数据-Storm流式框架(三)--Storm搭建教程
  • 【Django restframework】django跨域问题,解决PUT/PATCH/DELETE用ajax请求无法提交数据的问题
  • 鼠标移入移出修改滚动条的默认样式
  • Kafka磁盘写满日志清理操作
  • python自动化测试(二):xpath获取元素
  • 打印机连接网络后怎么安装驱动?
  • centos Let‘s Encrypt 免费https证书申请,并且自动续约
  • Docker:创建主从复制的Redis集群
  • OpenCV #以图搜图:感知哈希算法(Perceptual hash algorithm)的原理与实验
  • 二叉搜索树的实现
  • 外汇天眼:获利数倍、财务自由不是梦? 小心网络投资诈骗4阶段!
  • 文件加密丨最值得收藏的3种方法
  • 数据安全法开始正式实施的时间是什么时候?主要目的是什么?
  • 用Python做数据分析之数据处理及数据提取