当前位置: 首页 > article >正文

NCCL报错

1、报错信息:

raise RuntimeError("Distributed package doesn't have NCCL " "built in")

RuntimeError: Distributed package doesn't have NCCL built in

2、报错原因:

  windows系统不支持nccl,采用gloo;

3、报错解决:

  代码开头添加:

import os 
os.environ["PL_TORCH_DISTRIBUTED_BACKEND"] = "gloo"

或者

init_process_group(backend="nccl", rank=rank, world_size=world_size)
 # 修改为 
init_process_group(backend="gloo", rank=rank, world_size=world_size)

# windows users may have to use "gloo" instead of "nccl" as backend

# nccl: NVIDIA Collective Communication Library#

#windows用户可能必须使用“gloo”而不是“nccl”作为后端

#nccl:NVIDIA集体通信库


http://www.kler.cn/news/359802.html

相关文章:

  • 使用rust实现类似C#中的Convert数据转换类
  • Redis优劣势分析
  • 探索 Jupyter 核心:nbformat 库的神秘力量
  • 构建effet.js人脸识别交互系统的实战之路
  • 【C++刷题】力扣-#121-买卖股票的最佳时机
  • MySQL数据库从入门到精通 第1讲 基本概念
  • 训练VLM(视觉语言模型)的经验
  • 【新人系列】Python 入门(三):项目配置文件
  • 【python】OpenCV—Sort the Point Set from Top Left to Bottom Right
  • k8s 部署步骤整理(containerd)
  • 大数据-182 Elasticsearch - 原理剖析 数据结构-倒排索引、SkipList 跳表
  • 足浴店+闸机+智能衣柜+门票系统一体化管理系统解决方案——未来之窗行业应用跨平台架构
  • C#从零开始学习(GameObject实例)(unity Lab3)
  • 买横买坑不买竖, 卖点就在鼎沸处 (2700点下买入,3300点卖出)宽幅振荡
  • 【MySQL】清理二进制日志文件 binlog.000XXX 以解决 Ubuntu 系统磁盘空间耗尽的问题
  • K8S调度不平衡问题分析过程和解决方案
  • Python网络请求库requests的10个基本用法
  • 微信小程序canvas 生成二维码图片,画图片,生成图片,将两个canvas结合并保存图片
  • 探索 Jupyter 笔记本转换的无限可能:nbconvert 库的神秘面纱
  • 网络空间安全之一个WH的超前沿全栈技术深入学习之路(一:渗透测试行业术语扫盲)作者——LJS