当前位置: 首页 > article >正文

GPU — 8 卡 GPU 服务器与 NVLink/NVSwitch 互联技术

目录

文章目录

  • 目录
  • 8 卡 GPU 服务器
  • GPU 互联技术分类
  • PCIe 直连
  • PCIe Switch 互联
  • NVLink 互联
    • NVLink 1.0 与 DGX-1 系统
    • NVLink 2.0 与 DGX-1 系统
  • NVSwitch 全互联
    • NVSwitch 1.0 与 DGX-2 系统
    • NVLink 3.0、NVSwitch 2.0 与 DGX A100
    • NVLink 4.0、NVSwitch 3.0 与 DGX H100
  • NVSwitch v.s. PCIe Switch
  • GPU 互联的带宽性能测试

8 卡 GPU 服务器

随着模型复杂程度增加,单张 GPU 无法完成训练任务,需要联合多张 GPU,尤其在 LLM 时代,8 卡 GPU 服务器已经成为了新的常态。

在 8 卡 GPU 服务器中,CPU 仍然承担着系统管理、任务调度、逻辑运算等工作,而 GPU 则主要负责大规模并行计算任务。

在这里插入图片描述

GPU 互联技术分类

在深度学习的训练过程中,随着 GPU 算力的飞速飙升,GPU 之间的互联数据传输速度已经成为了制约训练效率的瓶颈。从网络构成的角度,可以分为:

  1. GPU 卡间互联
  2. GPU 服务器件互联

本文讨论的是单机 GPU 卡间互联。解决的问题就是如何将 8 张 GPU 互联起来,使其能够互相进行高效的通信。从互联技术的层面有以下 3 大类:

  1. PCIe 直连
  2. NVLink 互联
  3. NVSwitch 全互联

PCIe 直连

PCIe 直连


http://www.kler.cn/a/535758.html

相关文章:

  • “卫星-无人机-地面”遥感数据快速使用及地物含量计算的实现方法
  • android 打包AAR-引入资源layout-安卓封包
  • 在本地顺利的部署一个al模型从零开始 windows
  • CSS(三)less一篇搞定
  • SpringBoot开发(五)SpringBoot接收请求参数
  • 51单片机07 串口通信
  • 【AI】DeepSeek来了!!!
  • tolua[一]框架搭建,运行example
  • 【Day33 LeetCode】动态规划DP Ⅵ 背包问题
  • SQL Server的安装和简单使用
  • SQL精度丢失:CAST(ce.fund / 100 AS DECIMAL(10, 2)) 得到 99999999.99
  • 【Uniapp-Vue3】z-paging插件组件实现触底和下拉加载数据
  • 【Elasticsearch】random_sampler聚合
  • Leecode刷题C语言之全排列②
  • Spring Boot + Spring AI快速体验
  • Polardb三节点集群部署安装--附虚拟机
  • Linux 设备驱动分类(快速理解驱动架构)
  • 《大模型面试宝典》(2025版) 发布了
  • 国自然地区基金|基于深度学习多模态影像组学智能诊断非酒精性脂肪肝病的研究|基金申请·25-02-06
  • C#项目引用VB.NET 类库项目,生成一个EXE,这是什么原理
  • 【前端】【面试】【复习详解】【react】react生命周期--函数式全解
  • 深度剖析FFmpeg视频解码后的帧处理到Qt显示 从AVFrame到QImage的转换(一)
  • “卫星-无人机-地面”遥感数据快速使用及地物含量计算的实现方法
  • 【正点原子K210连载】第六十七章 音频FFT实验 摘自【正点原子】DNK210使用指南-CanMV版指南
  • Django settings详解
  • 在C#中,Array,List,ArrayList,Dictionary,Hashtable,SortList,Stack的区别