当前位置: 首页 > article >正文

【知识】cuda检测GPU是否支持P2P通信及一些注意事项

转载请注明出处:小锋学长生活大爆炸[xfxuezhagn.cn]

如果本文帮助到了你,欢迎[点赞、收藏、关注]哦~

代码流程

  1. 先检查所有GPU之间是否支持P2P通信;
  2. 然后尝试启用GPU之间的P2P通信;
  3. 再次检查所有GPU之间是否支持P2P通信。

test.cu:

#include <stdio.h>
#include <cuda_runtime.h>

void checkP2P(int deviceCount) {
    printf("\nChecking initial P2P support:\n");
    for (int i = 0; i < deviceCount; i++) {
        for (int j = 0; j < deviceCount; j++) {
            if (i != j) {
                int canAccessPeer = 0;
                cudaDeviceCanAccessPeer(&canAccessPeer, i, j);
                printf("GPU %d -> GPU %d: %s\n", i, j, canAccessPeer ? "Supported" : "Not Supported");
            }
        }
    }
}

void enableP2P(int deviceCount) {
    printf("\nEnabling P2P:\n");
    for (int i = 0; i < deviceCount; i++) {
        cudaSetDevice(i);
        for (int j = 0; j < deviceCount; j++) {
            if (i != j) {
                int canAccessPeer = 0;
                cudaDeviceCanAccessPeer(&canAccessPeer, i, j);
                if (canAccessPeer) {
                    cudaError_t err = cudaDeviceEnablePeerAccess(j, 0);
                    if (err == cudaSuccess) {
                        printf("P2P enabled between GPU %d and GPU %d.\n", i, j);
                    } else {
                        printf("Failed to enable P2P between GPU %d and GPU %d: %s\n", i, j, cudaGetErrorString(err));
                    }
                }
            }
        }
    }
}

void recheckP2P(int deviceCount) {
    printf("\nRechecking P2P support after enabling:\n");
    for (int i = 0; i < deviceCount; i++) {
        for (int j = 0; j < deviceCount; j++) {
            if (i != j) {
                int canAccessPeer = 0;
                cudaDeviceCanAccessPeer(&canAccessPeer, i, j);
                printf("GPU %d -> GPU %d: %s\n", i, j, canAccessPeer ? "Enabled" : "Disabled");
            }
        }
    }
}

int main() {
    int deviceCount;
    cudaGetDeviceCount(&deviceCount);

    if (deviceCount < 2) {
        printf("At least two GPUs are required for P2P testing.\n");
        return 0;
    }

    printf("Detected %d GPUs.\n", deviceCount);

    // Step 1: Check initial P2P support
    checkP2P(deviceCount);

    // Step 2: Enable P2P
    enableP2P(deviceCount);

    // Step 3: Recheck P2P support
    recheckP2P(deviceCount);

    return 0;
}

编译:

nvcc -o test test.cu

执行:

./test.cu


注意事项

1、官方提供的cuda_tool里的simpleP2P、p2pBandwidthLatencyTest也都可以检测是否支持P2P。

2、Bridges间不支持P2P通信:deploying-managing-gpu-clusters

3、相同PCIe complex下是支持P2P:ParallelComputing


部分不支持P2P的类型

Nvidia Confirms GeForce Cards Lack P2P


http://www.kler.cn/a/455911.html

相关文章:

  • day20-yum精讲
  • Unity3D如何优化物理模拟?
  • Please refer to dump files (if any exist) [date].dump, [date]-jvmRun[N]……解决
  • springboot+mybatis的整合
  • 力扣矩阵-算法模版总结
  • LaTeX 是一种基于标记的排版系统,广泛用于创建高质量的文档,特别是在需要复杂数学公式、表格、文献引用等的场景中
  • 源码分析之Openlayers中GeometryCollection类
  • S5700 V600R024C00 配置指南-工业网络 PROFINET
  • docker项目部署流程(Vue+Spingboot)
  • this的指向问题
  • JVM 及内存管理:掌握 Java 8 的内存模型与垃圾回收机制
  • 【Spring】基于XML的Spring容器配置——FactoryBean的使用
  • 【MySQL】SQL 优化经验
  • Java高级工程师1380道面试题(附答案)分享
  • 一个简单的深度学习模型例程,使用Keras(基于TensorFlow)构建一个卷积神经网络(CNN)来分类MNIST手写数字数据集。
  • iOS Masonry对包体积的影响
  • 深入了解 Java 字符串:基础、操作与性能优化
  • 【Java数据结构】LinkedList与链表
  • 电商项目-数据同步解决方案(二)首页广告缓存同步
  • python网络框架——Django、Tornado、Flask和Twisted