当前位置: 首页 > article >正文

YOLOv8改进,YOLOv8检测头融合DiverseBranchBlock,并添加小目标检测层(四头检测),适合目标检测、分割等


在这里插入图片描述


摘要

一种卷积神经网络(ConvNet)的通用构建模块,以在不增加推理时间成本的情况下提高性能。该模块被命名为多样分支块(Diverse Branch Block,DBB),通过结合不同尺度和复杂度的多样分支来丰富特征空间,包括卷积序列、多尺度卷积和平均池化,从而增强单个卷积的表示能力。在训练后,DBB可以等效地转换为一个单独的卷积层以进行部署。与新型ConvNet架构的进步不同,DBB在保持宏观架构的同时复杂化了训练时的微观结构,因此它可以作为任何架构的常规卷积层的替代品。通过这种方式,模型可以训练到更高的性能水平,然后转换为原始推理时的结构进行推理。DBB在图像分类(ImageNet上最高提高1.9%的top-1准确率)、目标检测和语义分割方面提高了ConvNet的性能。

DiverseBranchBlock介绍

多样分支块(DiverseBranchBlock)的代表性设计如下图所示(摘自论文):
在这里插入图片描述
1.DiverseBranchBlock(DBB)采用多分支拓扑结构,包括多尺度卷积、顺序1×1 - K×K卷积、平均池化和分支相加。这些具有不同感受野和复杂度的路径操作可以丰富特征空间,就像Inception架构一样。
2.DiverseBranchBlock(DBB)可以在推理时等效地转换为单个卷积。给定一个架构,可以用DBB替换一些常规卷积层,以构建更复杂的训练微观结构,并将其转换回原始结构,这样在推理时不会有额外的成本。

理论详解可以参考链接:论文地址
代码可在这个链接找到:代码地址


小目标理论

在YOLOv8 中,输入图像的尺寸为 640x640x3,经过 8 倍、16 倍和 32 倍下采样后分别得到 80x80、40x40 以及 20x20 大小的特征图,网络最终在这三个不同尺度的特征图上进行目标检测。在这三个尺度的特征图中,局部感受野最小的是 8 倍下采样特征图,即如果将该特征图映射到原输入图像,则每个网格对应原图 8x8 的区域。对于分辨率较小的目标而言,8 倍下采样得到的特征图感受野仍然偏大,容易丢失某些小目标的位置和细节信息。为了改善目标漏检现状,对 YOLOv8 的 Head 结构进行优化,在原有的三尺度检测头的基础之上,新增一个针对微小目标检测的检测头 ,YOLOv8 原有 P3、P4 和 P5 这 3 个输出层,分别用于检测小、中、大目标,增加 P2 检测层后,网络能在4个不同尺度的特征图上做检测,P2 能检测到最小目标分辨率为 4x4。通过增加小尺度检测头的方式,整个网络能在 4 倍、8 倍、16 倍和 32 倍下采样特征图上预测不同尺度的目标,大幅度提高了算


http://www.kler.cn/a/512565.html

相关文章:

  • mysql的测试方案
  • kafka学习笔记4-TLS加密 —— 筑梦之路
  • Linux——入门基本指令汇总
  • 【Linux】gawk编辑器二
  • leetcode——找到字符串中所有字母异位词(java)
  • wps数据分析000002
  • 手机怎么远程操控电脑?
  • 算法-求字符串公共前缀
  • Docker 部署 mysql
  • Java设计模式—观察者模式
  • Python实现PDF文档转图片功能
  • c++ 给定欧氏平面中的一组线可以形成的三角形的数量
  • 嵌入式Linux驱动开发之pinctrl和gpio子系统
  • 《Vue3 七》Vue 中的动画
  • 【语言处理和机器学习】概述篇(基础小白入门篇)
  • 蒙操作系统(HarmonyOS)
  • 具身智能新突破!Physical Intelligence推出机器人动作tokenizer,训练提速5倍
  • 高级java每日一道面试题-2025年01月20日-数据库篇-并发事务带来哪些问题?
  • JeecgBoot 低代码 AI 大模型集成 DeepSeek
  • 【云岚到家】-day03-门户缓存实现实战
  • 服务器日志自动上传到阿里云OSS备份
  • 【网络协议】【http】【https】RSA+AES-TLS1.2
  • Unity3D学习笔记(一)
  • Python绘制数据地图-MovingPandas
  • 【Qt 常用控件】显示类控件——QLabel
  • 最长递增子序列问题(Longest Increasing Subsequence),动态规划法解决,贪心算法 + 二分查找优化