当前位置: 首页 > article >正文

YOLOv11改进,YOLOv11检测头融合DiverseBranchBlock(多样分支块),并添加小目标检测层(四头检测),适合目标检测、分割等任务


在这里插入图片描述


摘要

一种卷积神经网络(ConvNet)的通用构建模块,以在不增加推理时间成本的情况下提高性能。该模块被命名为多样分支块(Diverse Branch Block,DBB),通过结合不同尺度和复杂度的多样分支来丰富特征空间,包括卷积序列、多尺度卷积和平均池化,从而增强单个卷积的表示能力。在训练后,DBB可以等效地转换为一个单独的卷积层以进行部署。与新型ConvNet架构的进步不同,DBB在保持宏观架构的同时复杂化了训练时的微观结构,因此它可以作为任何架构的常规卷积层的替代品。通过这种方式,模型可以训练到更高的性能水平,然后转换为原始推理时的结构进行推理。DBB在图像分类(ImageNet上最高提高1.9%的top-1准确率)、目标检测和语义分割方面提高了ConvNet的性能。

DiverseBranchBlock介绍

多样分支块(DiverseBranchBlock)的代表性设计如下图所示(摘自论文):
在这里插入图片描述
1.DiverseBranchBlock(DBB)采用多分支拓扑结构,包括多尺度卷积、顺序1×1 - K×K卷积、平均池化和分支相加。这些具有不同感受野和复杂度的路径操作可以丰富特征空间,就像Inception架构一样。
2.DiverseBranchBlock(DBB)可以在推理时等效地转换为单个卷积。给定一个架构,可以用DBB替换一些常规卷积层,以构建更复杂的训练微观结构,并将其转换回原始结构,这样在推理时不会有额外的成本。

理论详解可以参考链接:论文地址
代码可在这个链接找到:代码地址


小目标理论

在YOLOv11 中,输入图像的尺寸为 640x640x3,经过 8 倍、16 倍和 32 倍下采样后分别得到 80x80、40x40 以及 20x20 大小的特征图,网络最终在这三个不同尺度的特征图上进行目标检测。在这三个尺度的特征图中,局部感受野最小的是 8 倍下采样特征图,即如果将该特征图映射到原输入图像,则每个网格对应原图 8x8 的区域。对于分辨率较小的目标而言,8 倍下采样得到的特征图感受野仍然偏大,容易丢失某些小目标的位置和细节信息。为了改善目标漏检现状,对 YOLOv8 的 Head 结构进行优化,在原有的三尺度检测头的基础之上,新增一个针对微小目标检测的检测头 ,YOLOv11 原有 P3、P4 和 P5 这 3 个输出层,分别用于检测小、中、大目标,增加 P2 检测层后,网络能在4个不同尺度的特征图上做检测,P2 能检测到最小目标分辨率为 4x4。通过增加小尺度检测头的方式,整个网络能在 4 倍、8 倍、16 倍和 32 倍下采样特征图上预测不同尺度的目标,大幅度提高了算法的


http://www.kler.cn/a/512487.html

相关文章:

  • 深度学习在语音识别中的应用
  • MySQL配置my.ini文件
  • 软件的收费方式
  • lvm快照备份
  • 基于SpringBoot+Vue的智慧动物园管理系统的设计与实现
  • 使用 Java 和 FreeMarker 实现自动生成供货清单,动态生成 Word 文档,简化文档处理流程。
  • 国内汽车法规政策标准解读:GB 44495-2024《汽车整车信息安全技术要求》
  • Ubuntu 安装 docker 配置环境及其常用命令
  • SQLite 3.48.0 发布,有哪些更新?
  • 【K8S系列】在 K8S 中使用 Values 文件定制不同环境下的应用配置
  • 【深度学习】2.视觉问题与得分函数
  • JavaScript笔记APIs篇03——DOM节点Bom操作本地存储正则表达式
  • Ant Design Vue 的 a-input-number 组件限制最小值和最大值
  • c++常见设计模式之适配器模式
  • Ubuntu如何安装redis服务?
  • 【王树森搜素引擎技术】相关性03:文本匹配(TF-IDF、BM25、词距)
  • goodreads书籍评论爬取NRC Emotion Lexicon分析
  • Ae 表达式语言引用:Layer - 3D
  • excel 判断某个单元格的日期,如果超过3天,则在另一个单元格显示超过三天的公式
  • 【前端学习路线】前端入门 详细知识点学习路径(附学习资源)
  • VSCode下EIDE插件开发STM32
  • K8S中Pod控制器之DaemonSet(DS)控制器
  • Windows 服务器访问慢解决办法
  • 如何使用Spring Boot框架整合Redis:超详细案例教程
  • 日志(elk stack)基础语法学习,零基础学习
  • 【每日一题】LeetCode - 最长公共前缀