YOLOv11改进策略【模型轻量化】| 替换骨干网络为 ICCV 2023的EfficientViT 用于高分辨率密集预测的多尺度线性关注
一、本文介绍
本文记录的是基于EfficientViT的YOLOv11轻量化改进方法研究。EfficientViT
通过构建多尺度线性注意力模块
将全局感受野与多尺度学习相结合,并以此模块为核心构建网络,构建轻量级且硬件高效的操作,以提升性能并降低硬件部署难度。
本文在替换骨干网络中配置了原论文中的EfficientViT_M0
、EfficientViT_M1
、EfficientViT_M2
、EfficientViT_M3
、EfficientViT_M4
和EfficientViT_M5
6种模型,以满足不同的需求。
模型 | 参数量 | 计算量 | 推理速度 |
---|---|---|---|
YOLOv11m | 20.0M | 67.6GFLOPs | 3.5ms |
Improved | 11.8M | 31.1GFLOPs | 3.2ms |
专栏目录:YOLOv11改进目录一览 | 涉及卷积层、轻量化、注意力、损失函数、Backbone、SPPF、Neck、检测头等全方位改进
专栏地址:YOLOv11改进专栏——以发表论文的角度,快速准确的找到有效涨点的创新点!
文章目录
- 一、本文介绍
- 二、EfficientViT结构详解
-
- 2.1 设计出发点
- 2.2 原理
-
- 2.2.1 多尺度线性注意力模块(Multi - Scale Linear Attention)
- 2.2.2 基于多尺度线性注意力构建EfficientViT
- 2.3 结构
-
- 2.3.1 骨干(Backbone)
- 2.3.2 头部(Head)
- 2.4 优势