reduce-scatter:适合分布式计算;Reduce、LayerNorm和Broadcast算子的执行顺序对计算结果的影响,以及它们对资源消耗的影响
目录
Gather
Scatter
Reduce
reduce-scatter:适合分布式计算
Reduce、LayerNorm和Broadcast算子的执行顺序对计算结果的影响,以及它们对资源消耗的影响
计算结果理论正确性
资源消耗方面
Gather
这个也很好理解,就是把多个进程的数据拼凑在一起。
Scatter
不同于Broadcast, scatter可以将不同数据分发给不同的进程。
Reduce
reduce就是将多个进程中的数据按照指定的映射函数进行运算得到最后的结果存在一个进程中,例如下面两个图中的归约操作都是求和,将4个不同进程的数据归约求和后存在了第一个进程中