当前位置: 首页 > article >正文

XCCL、NCCL、HCCL通信库

在这里插入图片描述

XCCL提供的基本能力

在这里插入图片描述

XCCL提供的基本能力

在这里插入图片描述

不同的XCCL 针对不同的网络拓扑,实现的是不同的优化算法的(不同CCL库最大的区别就是这)
不同CCL库还会根据自己的硬件、系统,在底层上面对一些相对应的改动;
但是对上的API接口,基本上保持稳定和不变,也就是跟NVIDIA的NCCL 和 MPI的库的接口保持一致;
---- 公司肯定也是有部门在搞这个的

在这里插入图片描述


基于NCCL进行创新

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述


NVIDIA NCCL:优点、缺点

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

clos torus RDMA 异构网络…check


阿里 ACCL

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述


腾讯 TCCL

在这里插入图片描述

在这里插入图片描述
NVIDIA主推IB的交换机,腾讯自研交换机


Inter oneCCL

在这里插入图片描述

在这里插入图片描述


AMD RCCL(已开源)

在这里插入图片描述
在这里插入图片描述


各种XCCL库的优缺点

在这里插入图片描述


http://www.kler.cn/a/531445.html

相关文章:

  • 【C++】继承(下)
  • MongoDb user自定义 role 添加 action(collStats, EstimateDocumentCount)
  • 吴恩达深度学习——有效运作神经网络
  • 【大模型LLM面试合集】大语言模型架构_MHA_MQA_GQA
  • OpenEuler学习笔记(十四):在OpenEuler上搭建.NET运行环境
  • cpp实战项目—string类的模拟实现
  • 算法基础——一致性
  • 强化学习笔记(5)——PPO
  • c++ 定点 new 及其汇编解释
  • 数据结构之栈和队列(超详解)
  • 使用 Kotlin 将 Vertx 和 Springboot 整合
  • C++类的初始化列表是怎么一回事?哪些东西必须放在初始化列表中进行初始化,原因是什么?
  • MySQL(高级特性篇) 13 章——事务基础知识
  • Docker 部署 ClickHouse 教程
  • 搜索插入位置(35)
  • SpringBoot整合Mybatis|入门级增删改查|2025
  • Chromium132 编译指南 - Android 篇(五):获取源码
  • 八. Spring Boot2 整合连接 Redis(超详细剖析)
  • 自动化软件测试的基本流程
  • Ubuntu20安装docker
  • 【DeepSeek论文精读】6. DeepSeek R1:通过强化学习激发大语言模型的推理能力
  • coze扣子新一代AI应用开发平台
  • 利用matlab寻找矩阵中最大值及其位置
  • 详解分布式锁
  • 在K8S中,有哪几种控制器类型?
  • 深度学习 Pytorch 基础网络手动搭建与快速实现