当前位置: 首页 > article >正文

win操作系统下安装Deepspeed

1. 准备cunda环境

下载cuda、cudnn,

CUDA Toolkit Archive | NVIDIA Developericon-default.png?t=N7T8https://developer.nvidia.com/cuda-toolkit-archive

Log in | NVIDIA Developericon-default.png?t=N7T8https://developer.nvidia.com/rdp/cudnn-download 选择版本可以参考里的Index of /anaconda/cloud/pytorch/win-64/ | 清华大学开源软件镜像站 | Tsinghua Open Source Mirrorpytorch版本信息

具体流程可以参考【精选】CUDA安装教程(超详细)_Billie使劲学的博客-CSDN博客

2. 安装nvcc

下载安装包:

https://visualstudio.microsoft.com/zh-hans/thank-you-downloading-visual-studio/?sku=Community&channel=Release&version=VS2022&source=VSLandingPage&cid=2030&passive=false

需要选择“使用c++桌面开发”,之后按提示安装即可,最后按提示重启操作系统,在cmd窗口输入nvcc -v,即可查看安装信息

3. 安装pytorch环境

conda install pytorch=2.0.1 torchvision torchaudio pytorch-cuda=11.7 -c pytorch -c nvidia 

其中pytorch的版本需要根据需要调整

如果使用清华源安装pytorch,使用如下命令:

conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/pytorch/win-64/
conda install pytorch=2.0.1 torchvision torchaudio pytorch-cuda=11.7 -c nvidia 

安装完成后,需要推出conda的powershell prompt命令行,重新打开。否则python环境有可能会提示找不到torch

4. 从github上获取deepspeed代码

经过测试发现,pip install方式获取的deepspeed代码是无法在windows下使用的,所以需要根据requirements.txt上要求的版本从github上clone或直接从release里下载对应的版本。

比如,0.9.2版本的下载路径是:https://github.com/microsoft/DeepSpeed/archive/refs/tags/v0.9.2.zip

5. 编译代码

需要“以管理员身份运行”启动anaconda的powershell prompt命令行程序,执行

build_win.bat

报错1:

csrc/transformer/inference/csrc/pt_binding.cpp(537): error C2398: 元素“2”: 从“size_t”转换为“_Ty”需要收缩转换

可以参考:

如何在window10安装DeepSpeed chat(补充编译报错C2398部分)_deepspeed安装-CSDN博客

修改csrc/transformer/inference/csrc/pt_binding.cpp,加入(unsigned)

报错2:

LINK : fatal error LNK1181: 无法打开输入文件“aio.lib”

参考Win11系统下安装Deepspeed报错处理_vah101的博客-CSDN博客

6. 配置环境变量

编译完成后,在deepspeed的bin目录下,生产了deepspeed可执行文件,之后可以将deepspeed的bin目录增加到系统环境变量中配置path里,直接在命令行执行deepspeed不报错,就说明成功。

7. 使用的注意事项

此后,在安装其他的应用中,如果requirements.txt有deepspeed,需要将其deepspeed注释掉


http://www.kler.cn/a/104387.html

相关文章:

  • ChatGPT AIGC 快速合并Excel工作薄 Vlookup+INDIRECT
  • 树莓派系统文件解析
  • Leetcode刷题详解——山脉数组的峰顶索引
  • Qt篇——子控件QLayoutItem与实际控件的强转
  • VR软硬件测试知多少?
  • CSS笔记-狂神
  • C++标准模板(STL)- 类型支持 (类型特性,)
  • Python数据结构——数组
  • SpringCloudAlibaba实战-快速上手
  • selenium元素定位之xpath
  • Shopee本土店与跨境店有何区别?如何入驻?
  • 【idea】使用教程:idea 打开项目、配置、项目打包详细教程
  • LINUX挂载远程服务器上的目录到本地服务器
  • 中文编程开发语言编程实际案例:程序控制灯电路以及桌球台球室用这个程序计时计费
  • C语言之指针详解
  • 计算机网络——计算机网络体系结构(4/4)-计算机网络体系结构中的专用术语(实体、协议、服务,三次握手‘三报文握手’、数据包术语)
  • CTF-Crypto-第一天-常见编码and古典密码(入门学习笔记)(详)
  • javaEE -10(11000字详解5层重要协议)
  • 基于springboot基于会员制医疗预约服务管理系统项目【项目源码+论文说明】
  • 【Spring Cloud】如何确定微服务项目的Spring Boot、Spring Cloud、Spring Cloud Alibaba的版本