AdaPipe:通过自适应重新计算和细粒度的计算单元划分
目录
AdaPipe:通过自适应重新计算和划分优化管道并行
自适应重计算策略:
细粒度的计算单元划分:
AdaPipe通过引入自适应重计算策略
一、AdaPipe原理
二、举例说明
AdaPipe:通过自适应重新计算和划分优化管道并行
AdaPipe: Optimizing Pipeline Parallelism with
Adaptive Recomputation and Partitioning
大型语言模型(LLMS)已经展示了强大的能力,随着它们的大小和序列长度的增加,需要巨大的内存,因此需要更大的并行系统。广泛采用的流水线并行引入了更重和不平衡的内存消耗。重新计算是一种广泛使用的技术,可以缓解这个问