当前位置：首页 > article >正文

YOLOv10改进，YOLOv10替换主干网络为PP-HGNetV2(百度飞桨视觉团队自研，独家手把手教程，助力涨点)

article 2025/1/16 1:59:53

在这里插入图片描述

摘要

PP-HGNetV2(High Performance GPU Network V2) 是百度飞桨视觉团队自研的 PP-HGNet 的下一代版本，其在 PP-HGNet 的基础上，做了进一步优化和改进，最终在 NVIDIA GPU 设备上，将 “Accuracy-Latency Balance” 做到了极致，精度大幅超过了其他同样推理速度的模型。其在单标签分类、多标签分类、目标检测、语义分割等任务中，均有较强的表现。PP-HGNetV2 与常见的模型在精度-预测耗时的比较如下图所示。
在这里插入图片描述

模型细节

PP-HGNetV2 在 PP-HGNet 上的具体改进点如下：

改进了 PPHGNet 网络 stem 部分，堆叠更多的 2x2 卷积核以学习更丰富的局部特征，使用更小的通道数以提升大分辨率任务如目标检测、语义分割等的推理速度；
替换了 PP-HGNet 中靠后 stage 的较冗余的标准卷积层为 PW + DW5x5 组合，在获得更大感受野的同时网络的参数量更少，且精度可以进一步提升；
增加了 LearnableAffineBlock 模块，其可以在增加极少参数量的同时大幅提升较小模型的精度，且对推理时间无损；
重构了 PP-HGNet 网络的 stage 分布，使其涵盖了从 B0-B6 不同量级的模型，从而满足不同任务的需求。

代码可在这个链接找到：代码地址

本文在 YOLOv10 中的主干网络替换成 PP-HGNetV2，代码已经整理好了，跟着文章复制粘贴，即可直接运行

YOLOv10改进，YOLOv10替换主干网络为PP-HGNetV2(百度飞桨视觉团队自研，独家手把手教程，助力涨点)

摘要

模型细节

目录

相关文章：