当前位置: 首页 > article >正文

Linux系统配置深度学习环境之cudnn安装

前言

        一个针对深度学习应用优化的 GPU 加速库。它提供了高性能、高可靠性的加速算法,旨在加速深度神经网络模型的训练和推理过程。

        cuDNN 提供了一系列优化的基本算法和函数,包括卷积、池化、规范化、激活函数等,以及针对深度学习任务的高级功能,如循环神经网络(RNN)的支持。这些算法和函数充分利用了 NVIDIA GPU 的并行计算能力,提供了显著的性能加速。

        cuDNN 不仅可以用于传统的深度学习框架(如 TensorFlow、PyTorch、Caffe 等),还可以与 NVIDIA 的深度学习库 TensorRT 集成,实现深度学习模型的端到端优化和部署。

        使用 cuDNN 可以极大地提高深度学习训练和推理的速度和效率,减少模型的开发时间和运行成本。它广泛应用于各种领域的深度学习任务,如计算机视觉、自然语言处理、语音识别等。

        需要注意的是,cuDNN 是一个专门针对 NVIDIA GPU 的加速库,因此只能在支持 CUDA 的 GPU 上进行使用。并且,cuDNN 需要与适当版本的 NVIDIA 显卡驱动和 CUDA 工具包一起安装和配置才能发挥最佳性能。

        本篇文章单独讲解cudnn的安装,因为该方法适用于99%的Linux系统,在安装cudnn之前需要先安装cuda,cuda的安装请在Linux专栏查看我之前的文章。

cudnn安装

1、下载对应的cudnn版本

nvidia官网可以下载,但是需要进行注册登陆且下载非常的缓慢,可以在文章后进行下载。

从上图可以看到,有非常多的包,如何去下载自己需要的包呢?其中:

12.x        # 代表支持cuda12的任意版本

11.x        # 代表支持cuda11.0到11.8的任意版本

所以,只需要根据安装的cuda版本选择任意相应的版本即可。

2、以cudnn v8.8.1 for CUDA 11.x为例进行安装

下载tar.xz包后,使用tar命令进行解压

tar -xvf cudnn-linux-x86_64-8.8.1.3_cuda11-archive.tar.xz

解压后,进入解压后的目录:

cd cudnn-linux-x86_64-8.8.1.3_cuda11-archive

拷贝文件include和lib文件到cuda中:

cp  -P  cudnn-linux-x86_64-8.8.1.3_cuda11-archive/lib/*   /usr/local/cuda/lib64/

cp  -P  cudnn-linux-x86_64-8.8.1.3_cuda11-archive/include/*  /usr/local/cuda/include/

完毕!!!

        到此,linux系统的cudnn就已经安装完成,安装很简单方便,唯一就是下载cudnn的包比较麻烦,这里提供目前8.8.0以上的所有tar.xz的安装包下载地址,如需其他版本的,请在评论区留言或私信我。

12.x的下载地址:

cudnn-linux-x86-64-8.9.0.131-cuda12-archive.tar.xz资源

cudnn-linux-x86-64-8.8.1.3-cuda12-archive.tar.xz资源

11.x的下载地址:

cudnn-linux-x86-64-8.9.0.131-cuda11-archive.tar.xz资源

cudnn-linux-x86-64-8.8.1.3-cuda11-archive.tar.xz资源


http://www.kler.cn/a/156153.html

相关文章:

  • 动态规划 —— 子数组系列-最大子数组和
  • 【前端】JavaScript高级教程:线程机制与事件机制
  • OLED 显示画面的变换操作——上下、左右翻转
  • layui 文件上传前检查文件大小,后面再点上传出现重复提交的问题
  • 提升法律文书处理效率的秘密武器:开源文档比对工具解析
  • 【量化交易笔记】14.模拟盘效果
  • 40 mysql join 的实现
  • jmeter下载地址
  • [Java] 模拟Jdk 以及 CGLib 代理原理
  • 网络接口规范
  • springBoot整合task
  • uniapp中uni.navigateBack返回后刷新页面数据
  • 线程池大小设置多少,比较合适?
  • 如何从 Jira 成功迁移到极狐GitLab,看这个就够了!
  • [leetcode 哈希表] 模版
  • AtCoder Beginner Contest 331 题解 A-E
  • postgreSQL 查询所有模式的语句
  • 算法设计与实现--动态规划篇
  • Matlab和python详解数独谜题问题
  • 2、设计在链式存储结构上交换二叉树中所有结点左右子树的算法。
  • MySQL进阶部分
  • C语言--每日选择题--Day34
  • (C)一些题6
  • 如何快速看懂市场行情?
  • 视频生成的发展史及其原理解析:从Gen2、Emu Video到PixelDance、SVD、Pika 1.0
  • 流媒体方案之Nginx——实现物联网视频监控项目