当前位置：首页 > article >正文

GPU — 8 卡 GPU 服务器与 NVLink/NVSwitch 互联技术

article 2025/2/8 0:45:12

目录

文章目录

目录
8 卡 GPU 服务器
GPU 互联技术分类
PCIe 直连
PCIe Switch 互联
NVLink 互联
- NVLink 1.0 与 DGX-1 系统
- NVLink 2.0 与 DGX-1 系统
NVSwitch 全互联
- NVSwitch 1.0 与 DGX-2 系统
- NVLink 3.0、NVSwitch 2.0 与 DGX A100
- NVLink 4.0、NVSwitch 3.0 与 DGX H100
NVSwitch v.s. PCIe Switch
GPU 互联的带宽性能测试

8 卡 GPU 服务器

随着模型复杂程度增加，单张 GPU 无法完成训练任务，需要联合多张 GPU，尤其在 LLM 时代，8 卡 GPU 服务器已经成为了新的常态。

在 8 卡 GPU 服务器中，CPU 仍然承担着系统管理、任务调度、逻辑运算等工作，而 GPU 则主要负责大规模并行计算任务。

在这里插入图片描述

GPU 互联技术分类

在深度学习的训练过程中，随着 GPU 算力的飞速飙升，GPU 之间的互联数据传输速度已经成为了制约训练效率的瓶颈。从网络构成的角度，可以分为：

GPU 卡间互联
GPU 服务器件互联

本文讨论的是单机 GPU 卡间互联。解决的问题就是如何将 8 张 GPU 互联起来，使其能够互相进行高效的通信。从互联技术的层面有以下 3 大类：

PCIe 直连
NVLink 互联
NVSwitch 全互联

PCIe 直连

PCIe 直连

http://www.kler.cn/a/535758.html

相关文章：

“卫星-无人机-地面”遥感数据快速使用及地物含量计算的实现方法

android 打包AAR-引入资源layout-安卓封包

在本地顺利的部署一个al模型从零开始 windows

CSS(三）less一篇搞定

SpringBoot开发（五）SpringBoot接收请求参数

51单片机07 串口通信

【AI】DeepSeek来了！！！

tolua[一]框架搭建，运行example

【Day33 LeetCode】动态规划DP Ⅵ 背包问题

SQL Server的安装和简单使用

SQL精度丢失：CAST(ce.fund / 100 AS DECIMAL(10, 2)) 得到 99999999.99

【Uniapp-Vue3】z-paging插件组件实现触底和下拉加载数据

【Elasticsearch】random_sampler聚合

Leecode刷题C语言之全排列②

Spring Boot + Spring AI快速体验

Polardb三节点集群部署安装--附虚拟机

Linux 设备驱动分类（快速理解驱动架构）

《大模型面试宝典》(2025版) 发布了

国自然地区基金｜基于深度学习多模态影像组学智能诊断非酒精性脂肪肝病的研究｜基金申请·25-02-06

C#项目引用VB.NET 类库项目，生成一个EXE，这是什么原理

【前端】【面试】【复习详解】【react】react生命周期--函数式全解

深度剖析FFmpeg视频解码后的帧处理到Qt显示从AVFrame到QImage的转换（一）

“卫星-无人机-地面”遥感数据快速使用及地物含量计算的实现方法

【正点原子K210连载】第六十七章音频FFT实验摘自【正点原子】DNK210使用指南-CanMV版指南

Django settings详解

在C#中,Array,List,ArrayList,Dictionary,Hashtable,SortList,Stack的区别