当前位置: 首页 > article >正文

Debain12.9安装NCCL GPU通讯组件

Debain12.9安装NCCL GPU通讯组件

  • 硬件信息
  • 安装NCCL组件
  • 测试NCCL组件

硬件信息

操作系统:Debain 12.9/Ubuntu 24.04
CPU:i7-10750H
内存:32G
显卡:GTX 1650(4G)
硬盘:SSD(1T)

系统安装时选择清华大学源

安装NCCL组件

wget https://developer.download.nvidia.cn/compute/cuda/repos/ubuntu2404/x86_64/cuda-keyring_1.1-1_all.deb
dpkg -c cuda-keyring_1.1-1_all.deb.1
dpkg -i cuda-keyring_1.1-1_all.deb.1
cp /etc/apt/sources.list /etc/apt/sources.list.d/sources-testing.list
vi /etc/apt/sources.list.d/sources-testing.list
   %s/bookworm/testing/g
apt update
apt install -y libc6-dev libc6
apt install -y libnccl2 libnccl-dev
mv /etc/apt/sources.list.d/sources-testing.list /etc/apt/sources.list.d/sources-testing.list.bak
ldconfig -p | grep libnccl

测试NCCL组件

git clone https://gitee.com/xqxyxchy/nccl-tests.git
cd nccl-tests && make
# ./build/all_reduce_perf -b 8 -e 256M -f 2 -g <num_gpus>
# 替换 <num_gpus> 为 GPU 数量
./build/all_reduce_perf -b 8 -e 256M -f 2 -g 1
# ./build/all_reduce_perf -b 8 -e 256M -f 2 -g <num_gpus> -c 1 -n 100 -m <IPs>
# 替换 <num_gpus> 为 GPU 数量
# 替换 <IPs> 为 参与机器IP,用,分割
./build/all_reduce_perf -b 8 -e 256M -f 2 -g 1 -c 1 -n 100 -m 92.168.3.18,192.168.3.17

http://www.kler.cn/a/561462.html

相关文章:

  • DeepEP通信库
  • Vue.js 编写组件单元测试
  • 一个std::async的示例
  • 【Linux进程三】进程的状态
  • XTOM工业级蓝光三维扫描仪在笔记本电脑背板模具全尺寸检测中的高效精准应用
  • 001第一个flutter文件
  • 源码分享1:批量修改PDF文件名称
  • 【MySQL篇】MySQL操作库
  • LIS系统源码,医院检验系统源码,lis软件源码
  • Java Web开发实战与项目——项目集成与部署
  • 1 什么是微服务?MybatisPlus框架
  • NVIDIA DLI引领创新课程:基于提示工程的LLM应用开发探索
  • 如何在Ubuntu 22.04或20.04 Linux上安装MobaXterm
  • 力扣2454. 下一个更大元素 IV
  • 电脑键盘知识
  • 【视频2 - 4】初识操作系统,Linux,虚拟机
  • windows断网,提示无法自动将ip协议堆栈绑定到网络适配器的解决办法
  • Oracle 数据泵迁移步骤规范
  • 双周报Vol.66: String模式匹配增强、while条件支持使用 is 表达式、新增IDE安装器...多项核心技术更新!
  • ui设计公司兰亭妙微分享:科研单位UI界面设计