当前位置: 首页 > article >正文

目标检测——Cascade R-CNN算法解读

论文:
Cascade R-CNN: Delving into High Quality Object Detection (2017.12.3)
链接:https://arxiv.org/abs/1712.00726
Cascade R-CNN: High Quality Object Detection and Instance Segmentation (2019.6.24)
链接:https://arxiv.org/abs/1906.09756
作者:Zhaowei Cai, Nuno Vasconcelos
代码:https://github.com/zhaoweicai/cascade-rcnn(Caffe) 与 https://github.com/zhaoweicai/Detectron-Cascade-RCNN (Detectron)


R-CNN系列其他文章:

  • R-CNN算法解读
  • SPPNet算法解读
  • Fast R-CNN算法解读
  • Faster R-CNN算法解读
  • Mask R-CNN算法解读
  • Cascade R-CNN算法解读
  • Libra R-CNN算法解读

目录

  • 1、算法概述
  • 2、Cascade R-CNN细节

1、算法概述

目标检测算法中,训练用的正负样本是通过IoU阈值来定义的,低IoU阈值(比如0.5)通常会产生噪声检测。然而,随着IoU阈值的增加,检测性能趋于下降。作者认为主要有以下两点原因,一是由于IoU阈值增加会导致正样本减少,训练过程中容易造成过拟合;二是在推理阶段模型最优的IoU与输入预测的IoU 之间会产生不匹配。为了应对上述问题,作者提出了Cascade R-CNN,它由一系列经过IoU阈值训练的检测器组成,从而对接近的误报(困难负样本)具有更强的选择性。检测器是分阶段训练的,为了减少过拟合问题。在推理中应用了相同的级联过程,使得每个阶段的假设和检测器质量之间的匹配更加紧密。


2、Cascade R-CNN细节

作者给出了Cascade R-CNN与Faster R-CNN流程对比图,如下图所示。
在这里插入图片描述
图(a)代表Faster R-CNN,图中包含两个阶段,H0,B0,C0代表第一个阶段,用于提出候选区域,也就是Faster R-CNN中的RPN网络结构,RPN网络的输出B0代表输出的候选框,B0再应用ROI pooling经过后续检测头H1得到最终的输出C1和B1。
而图(d)就是作者所提的Cascade R-CNN结构,作者认为要求单一回归量在所有质量水平上(即不同IoU样本)表现完全一致是非常困难的。受到姿态回归和人脸对齐的启发,作者将复杂的回归任务分解为一系列更简单的步骤。
在这里插入图片描述
T代表总共包含T个级联回归器,且每个级联回归器都是在当前样本{bt}分布下是最优的。论文中,作者通过实验取T值为3。

图(d)看起来和图(b)的框架图一样,但有着如下三点不同:

  1. 图(b)只是Faster R-CNN在做推理时的优化改进,迭代BBox是一种用于改进边界框的后处理过程,而图(d)的分层回归是一种重采样过程,它改变了不同阶段要处理的假设的分布。
  2. 由于图(d)同时用于训练和推理,所以训练分布和推断分布之间没有差异。
  3. 图(d)是针对不同阶段的重采样分布,对多个专门化回归量{fT,fT−1,···,f1}进行优化。这与图(b)中用同一个回归器迭代推断方式相反,它只对初始分布是最优的。这些差异使定位比迭代推断更精确。图(b)的迭代推理方式可用公式表示如下:
    在这里插入图片描述
    它只会优化一个回归器,但推理迭代的时候根据不同IoU值重复迭代使用,这种方式是次优的,且后续需要大量的人工参与,比如累计提议、预测投票等方式。

http://www.kler.cn/news/355547.html

相关文章:

  • 一波基于winform和wpf的桌面端界面,历久弥新。
  • 数据结构(JAVA)包装类泛型
  • 如何测试IP速度?
  • 5G NR:UE初始接入信令流程浅介
  • 从头开始的可视化数据 matplotlib:初学者努力绘制数据图
  • Flink CDC同步mysql数据到doris
  • 如何用pyhton修改1000+图片的名字?
  • 【深入解析】ChatGPT各版本在论文写作中的五大表现差异
  • Vscode 如何设置自定义快捷键
  • 深度学习速通系列:超长法律文件隐私过滤(基于预训练模型Bert)
  • R语言机器学习算法实战系列(六)K-邻近算法 (K-Nearest Neighbors)
  • 笔试题总结
  • 【复盘笔记】25国考一期_套题1
  • 9.6 Linux_I/O_IO模型
  • 开源 AI 智能名片 2+1 链动模式 S2B2C 商城小程序:企业产供销全流程的创新驱动
  • {输电线路监控设备功耗}
  • 疗愈门店系统|个案疗愈系统|疗愈小程序对美业门店管理有哪些作用?美业收银系统源码
  • 代理 IP 在 AI 爬虫中的关键应用
  • 华为开发者论坛入口
  • 华为HCIP-openEuler认证详解