(8)YOLOv6算法基本原理
一、YOLOv6 模型原理
-
发布日期:2022年6月
-
作者:美团技术团队
骨干网络:参考了 RepVGG 的设计,将重参数化能力进行补强,增强了模型结构的重参数化能力。使用了深度可分离卷积和跨阶段连接等技术,旨在提升模型的准确性和效率。使用轻量化网络作为基础网络,名为 EfficientRep 。
颈部结构:使用特征金字塔网络(Rep-PAN)来实现特征融合,并保持较好的多尺度特征融合能力。其通过步长为2的重参数化卷积层替换普通卷积层,减少了模型的内存需求。受 RepVGG 启发,YOLOv6 的颈部设计也追求了高效的特征传递和重参数化策略。
输出端: YOLOv6 将边框回归和类别的分类过程分开,不仅加快了收敛速度,也降低了计算l量。
内存与延迟:YOLOv6 在改进计算效率和模型大小的同时可能在 GPU 上增加了一定的计算延迟,同时节约了内存带宽。
目标检测性能:通过这些技术的改进,YOLOv6力图达到在保持高检测精度的同时减少模型的计算量和内存占用,加强整体模型的环境适应能力
二、YOLOv6 和YOLOv5的差异
区别1:首先,它将骨干网络从 CSPDarknet53 转换为一种高效的可重参数化的 EfficientRep 网络。
区别2:在训练阶段,EfficientRep 网络主要由 RepBlock 组成,其中 RepBlock 包含多个 RepVGGBlock。
区别3:在推理阶段,RepBlock 可以重参数化为单分支的 VGG 式结构,从而在不明显影响精度的情况下显著提高推理速度。
区别4:其次,YOLOv6 采用了修改后的 Rep-PAN拓扑结构作为颈部网络,取代了 YOLOv5 中使用的 CSP-Block。这旨在实现高效推理的同时,保持较好的多尺度特征融合能力。
区别5:最后,为解决 YOLOv5 中耦合头部导致的分类和定位两分支参数强行共享问题,YOLOv6 引入了混合通道策略,将多分支输出头的分类和回归分支解耦,分别经过不同的卷积层去学习各自的参数,从而构建更高效的解耦头部。
三、往期回顾
yolo入门教程:《吐血录制,yolo11猫狗实时检测实战项目,从零开始写yolov11代码》,视频全程25分钟。
(1)yolo11猫狗实时检测实战项目,从零开始写yolov11代码
(2)从零开始学yolo之yolov1的技术原理
(3)YOLOv1训练过程,新手入门
(4)YOLOv2和yolov1的差异
(5)YOLOv3和yolov1、yolov2之间的差异
(6)YOLOv4算法基本原理以及和YOLOv3 的差异
(13)10张结构图,深入理解YOLOv11算法各个模块
高清视频,3分钟揭秘神经网络技术原理
Transfermer的Q、K、V设计的底层逻辑