当前位置: 首页 > article >正文

大模型训练-gpu显卡训练环境搭建

背景

CentOs7.9系统中,NVIDA A40显卡,安装基于GPU训练的tf环境;

软件版本选择:

驱动:Driver Version: 470.256.02
cuda:CUDA Version: 11.2
cudnn:8.1.1
python:3.8
tf:2.6.0

安装步骤:

1.安装驱动(可问豆包如何卸载之前的版本)
$wget https://cn.download.nvidia.com/XFree86/Linux-x86_64/470.256.02/NVIDIA-Linux-x86_64-470.256.02.run
$chmod a+x NVIDIA-Linux-x86_64-470.256.02.run
$sudo ./NVIDIA-Linux-x86_64-470.256.02.run

2.下载并安装cuda11.2(可问豆包如何卸载之前的版本)
$wget https://developer.download.nvidia.com/compute/cuda/11.2.2/local_installers/cuda_11.2.2_460.32.03_linux.run
$chmod +x cuda_11.2.2_460.32.03_linux.run
$sudo ./cuda_11.2.2_460.32.03_linux.run --toolkit --toolkitpath=你的安装目录/cuda-11.2 --silent
$vi ~/.bashrc
文件末尾添加:
export PATH=你的安装目录/cuda-11.2/bin:$PATH
export LD_LIBRARY_PATH=你的安装目录/cuda-11.2/lib64:$LD_LIBRARY_PATH

3.下载并安装cudnn v8.1.1
NVIDA官网注册,并下载cudnn版本 https://developer.nvidia.com/rdp/cudnn-archive
cudnn-11.2-linux-x64-v8.1.1.33.tgz 
$tar -xvf cudnn-11.2-linux-x64-v8.1.1.33.tgz 
$sudo cp cuda/include/cudnn*.h 你的安装目录/cuda-11.2/include
$sudo cp cuda/lib64/libcudnn* 你的安装目录/cuda-11.2/lib64
$sudo chmod a+r 你的安装目录/cuda-11.2/include/cudnn*.h 你的安装目录/cuda-11.2/lib64/libcudnn*
验证安装情况:
验证驱动版本
$nvidia-smi 
验证cuda版本
$nvcc --version
安装py及tf
$conda create -n tf2.6 python=3.8
$conda activate tf2.6
$pip install tensorflow-gpu==2.6.0
验证gpu是否可用
import tensorflow as tf
print(tf.test.is_gpu_available())
返回true即为可用

http://www.kler.cn/a/540496.html

相关文章:

  • 【目标检测xml2txt】label从VOC格式xml文件转YOLO格式txt文件
  • DFS+回溯+剪枝(深度优先搜索)——搜索算法
  • U3D支持webgpu阅读
  • graylog初体验
  • Elasticsearch 生产集群部署终极方案
  • 《ARM64体系结构编程与实践》学习笔记(四)
  • ArcGIS Pro批量创建离线服务sd包
  • Kitchen Gadgets
  • Qt:项目文件解析
  • 海云安开发者智能助手(D10)全面接入DeepSeek,赋能开发者安全高效编码新范式
  • JavaScript特效大全:343个动态效果实例教程
  • 【信息系统项目管理师-案例真题】2017下半年案例分析答案和详解
  • 一键查看电脑各硬件详细信息 轻松查看电脑硬件参数
  • 03/29 使用 海康SDK 对接时使用的 MysqlUtils
  • 利用蓝耘智算平台深度搭建deepseek R1模型,进行深度机器学习
  • Selenium常用自动化函数
  • STM32 HAL库 ADC程序(C语言)
  • 剖析 C++ 模拟算法:数据结构、随机数生成与模型验证
  • UE5--浅析委托原理(Delegate)
  • AWS SES 邮件声誉监控与优化最佳实践
  • 大模型融入推荐系统
  • 【Unity】性能优化:UI的合批 图集和优化
  • 基于Java的自助多张图片合成拼接实战
  • 洛谷 P1015:回文数 ← 高精度加法
  • 宇宙大爆炸3D粒子特效实现原理详解
  • 【jmeter】在windows中,创建的变量,在jmeter中,读取变量失败的问题,路径问题