Yolo11改进策略:Block改进|使用FastVit的RepMixerBlock改进Yolo11,重参数重构助力Yolo11涨点(全网首发)
文章目录
- 摘要
- FastViT:一种使用结构重新参数化的快速混合视觉变换器
- 1、简介
- 2、相关工作
- 3、体系结构
-
- 3.1、概述
- 3.2、FastViT
-
- 3.2.1、重新参数化跳过连接
- 3.2.2、线性训练时间过参数化
- 3.2.3、大核卷积
- 4、实验
-
- 4.1、图像分类
- 4.2、鲁棒性评价
- 4.3、3D Hand网格估计
- 4.4、语义分割和目标检测
- 5、结论
- 改进方法
- 总结
摘要
一、论文介绍
本文基于FastViT架构中的RepMixerBlock模块,提出了一种对Yolo11网络的改进策略。FastViT是一种混合视觉Transformer架构,它通过引入新型的token混合运算符RepMixer,实现了先进的延迟-准确性权衡。RepMixer模块使用结构重参数化技术降低了网络中的跳过连接,从而减少了内存访问成本。本文将这种高效的模块应用于Yolo11网络中,旨在提升其性能。
二、创新点
本文的创新点在于将FastViT架构中的RepMixerBlock模块成功引入Yolo11网络,替换了原有的Bottleneck模块。这一替换不仅保持了Yolo11网络的实时性,还显著提升了其目标检测精度。
三、方法
在改进方法中,我们首先对Yolo11网络进行了深入分析,确定了Bottleneck模块为网络性能提升的瓶颈所在。随后,我们根据FastViT架构中的RepMixerBlock模块设计原理,对其进行了适当的调整和优化,以适应Yolo11网络的需求。最后,我们将优化后的RepMixerBlock模块替换到Yolo11网络中的Bottleneck模块位置,完成了网络的改进。
四、模块作用
RepMixerBlock模块