当前位置: 首页 > article >正文

YOLO系列论文综述(从YOLOv1到YOLOv11)【第12篇:YOLOv9——可编程梯度信息(PGI)+广义高效层聚合网络(GELAN)】

YOLOv9

  • 1 摘要
  • 2 改进点
  • 3 网络架构


YOLO系列博文:

  1. 【第1篇:概述物体检测算法发展史、YOLO应用领域、评价指标和NMS】
  2. 【第2篇:YOLO系列论文、代码和主要优缺点汇总】
  3. 【第3篇:YOLOv1——YOLO的开山之作】
  4. 【第4篇:YOLOv2——更好、更快、更强】
  5. 【第5篇:YOLOv3——多尺度预测】
  6. 【第6篇:YOLOv4——最优速度和精度】
  7. 【第7篇:YOLOv5——使用Pytorch框架、AutoAnchor、多尺度预训练模型】
  8. 【第8篇:YOLOv6——更高的并行度、引入量化和蒸馏以提高性能加速推理】
  9. 【第9篇:YOLOv7——跨尺度特征融合】
  10. 【第10篇:YOLOv8——集成检测、分割和跟踪能力】
  11. 【第11篇:YOLO变体——YOLO+Transformers、DAMO、PP、NAS】
  12. 【第12篇:YOLOv9——可编程梯度信息(PGI)+广义高效层聚合网络(GELAN)】
  13. 【第13篇:YOLOv10——实时端到端物体检测】
  14. 【第14篇:YOLOv11——在速度和准确性方面具有无与伦比的性能】
  15. 【第15篇(完结):讨论和未来展望】

1 摘要

  • 发布日期:2024年2月
  • 作者/贡献者:WongKinYiu等
  • 论文:YOLOv9: Learning What You Want to Learn Using Programmable Gradient Information
  • 代码:https://github.com/WongKinYiu/yolov9
  • 主要优缺点
    • 可编程梯度信息(PGI)+广义高效层聚合网络(GELAN);
    • 与YOLOv8相比,其出色的设计使深度模型的参数数量减少了49%,计算量减少了43%,但在MS COCO数据集上仍有0.6%的AP改进。

2 改进点

YOLOv9于2024年2月发布,代表了主流YOLO变体的最新进展。YOLOv9拥有两项关键创新:可编程梯度信息(PGI)框架和通用高效层聚合网络(GELAN)。

  • 可编程梯度信息(PGI)框架 旨在解决深层神经网络中固有的信息瓶颈问题,并使深度监督机制能够与轻量级架构兼容。通过实施PGI,无论是轻量级还是深层架构都能在准确性上获得显著提升,因为PGI确保了训练过程中可靠的梯度信息,从而增强了架构的学习能力和做出准确预测的能力。

  • 通用高效层聚合网络(GELAN) 架构特别设计用于通过高效率和轻量化来提升目标检测任务的性能。GELAN在不同的计算块和深度配置下表现出高性能,使其适合部署在各种推理设备上,包括资源受限的边缘设备。

通过结合上述两个框架(PGI和GELAN),YOLOv9在轻量级目标检测方面取得了显著的进步。

尽管YOLOv9仍处于早期阶段,但它已经在目标检测任务中展现了极强的竞争力,在参数减少和计算效率方面超越了YOLOv8,同时在MS COCO数据集上的平均精度(AP)提高了0.6%。

3 网络架构

下图展示了YOLOv9的网络架构图。

网络架构


http://www.kler.cn/a/417973.html

相关文章:

  • TiDB 无统计信息时执行计划如何生成
  • 单片机学习笔记 15. 串口通信(理论)
  • 如何在 Ubuntu 18.04 上设置 Apache 虚拟主机
  • 修改IDEA配置导致Spring Boot项目读取application.properties中文乱码问题
  • 基于Pytorch的CIFAR100数据集上从ResNet50到VGG16的知识蒸馏实验记录
  • 三维渲染中顺序无关的半透明混合(OIT)(一Depth Peeling)
  • Rust学习笔记_02——数组
  • 可视化大屏系统如何实现3D数据导入与Web交互?
  • SpringAi整合大模型(进阶版)
  • MyBatis-Plus - 查询解析数据异常处理
  • Linux内核机制自学笔记
  • spring-boot自定义ApplicationListener及源码分析
  • SVN迁移至Git,保留commit提交记录
  • 使用Spring Data MongoDB中的MongoTemplate实现分组查询最新的数据
  • 设计模式---建造者模式
  • 迅为RK3588开发板Android12源码定制开发-安装adb驱动
  • 飙升Vue.js组件开发
  • Flutter 1.1:下载Flutter环境
  • 一个鸿蒙开发者的探索:实现相册访问功能
  • Python+Pytest+Yaml+Allure数据参数化(DDT)数据驱动(一)
  • 前端css实例
  • 【04】Selenium+Python 手动添加Cookie免登录(实例)
  • 何时在 SQL 中使用 CHAR、VARCHAR 和 VARCHAR(MAX)
  • Golang context 的作用和实现原理
  • 7. 现代卷积神经网络
  • 【051】基于51单片机温度计【Proteus仿真+Keil程序+报告+原理图】