当前位置: 首页 > article >正文

YOLOv11算法解析

YOLO系列简介

  YOLO系列主要以ultralytics[v5,v8,v11]为主体发展,WongKinYiu[v7,v9]和meituan[v6],v10则是在ultralytics的框架上进行创新改进,目前也归属到ultralytics中。

  V11支持多种视觉任务:物体检测、实例分割、图像分类、姿态估计和定向物体检测(OBB)。

  而本文主要以V8与V11进行对比,分析ultralytics团队主要做出的改进贡献。

YOLOv8到YOLOv11的演化

 配置文件: https://github.com/ultralytics/ultralytics/tree/main/ultralytics/cfg/models

 解析函数:ultralytics/ultralytics/nn/tasks.py at main · ultralytics/ultralytics · GitHub

对比YOLOV8主要涉及到:

*backbone 中的使用C2f模块 变为 c3k2 模块。

*backbone 中的最后一层(sppf层)后增加了C2PSA模块。

*head 解耦头中的分类检测头两个Conv 变为 DWConv。

整体技术而言:

*backbone 使用了C2K2模块+最后SPPF模块级联C2PSA模块;

*neck 使用PAN结构,并且里面也使用C3K2模块;

*head使用了anchor-free + Decoupled-head,其中回归头使用正常的卷积,分类头使用DWConv;

*损失函数使用了分类BCE、回归CIOU + VFL的组合;

*框匹配策略由静态匹配改为了Task-Aligned Assigner匹配方式;

*训练策略没有提及,其中YOLOV8可以参考如下最后 10 个 epoch 关闭 Mosaic 的操作、训练总 epoch 数从 300 提升到了 500。


http://www.kler.cn/news/366712.html

相关文章:

  • springboot入门学习笔记
  • 寻找大自然的颜色
  • Linux -- 共享内存(2)
  • C++游戏开发
  • Jetpack架构组件_LiveData组件
  • spring整合使用xml方式整合Druid数据源连接池
  • WPF+MVVM案例实战(三)- 动态数字卡片效果实现
  • 已解决 django.db.utils.OperationalError: (1051, “Unknown table
  • Vue3 学习笔记(七)Vue3 语法-计算属性 computed详解
  • 基于SpringBoot的宠物爱好者交流系统的设计与实现(源码+定制+开发)
  • 厉兵秣马之Java 语言基础和进阶(二)
  • leetcode动态规划(十七)-组合总和IV
  • Python小游戏9——天天酷跑
  • Laravel使用 Swagger
  • 超详细Redis安装配置【包成功的】
  • 系统架构设计师 软件架构的定义与生命周期
  • week08 zookeeper多种安装与pandas数据变换操作-new
  • UE5学习笔记26-添加游戏热身时间,比赛时间,重新开始比赛
  • 【jvm】所有的线程都共享堆吗
  • 【mysql进阶】4-7. 通用表空间
  • 理解 python 类
  • 某ai gpt的bug
  • go的web服务器框架
  • 南京林业大学生态学博士在1区top期刊揭示人工林发育促进土壤团聚体的形成与稳定:对土壤碳氮固存的启示
  • 多端项目开发全流程详解 - 从需求分析到多端部署
  • C语言 | Leetcode C语言题解之第508题斐波那契数