当前位置: 首页 > article >正文

论文笔记: Boosting Object Detection with Zero-Shot Day-Night Domain Adaptation

文章目录

  • Boosting Object Detection with Zero-Shot Day-Night Domain Adaptation
    • 论文中的知识补充
      • Retinex
    • 动机
      • 现状
      • 问题
    • 贡献
    • 方法

Boosting Object Detection with Zero-Shot Day-Night Domain Adaptation

论文链接: https://openaccess.thecvf.com/content/CVPR2024/html/Du_Boosting_Object_Detection_with_Zero-Shot_Day-Night_Domain_Adaptation_CVPR_2024_paper.html
代码链接: https://github.com/ZPDu/DAI-Net

论文中的知识补充

主要包含没有了解的论文中提到的知识(相关工作/知识盲区)

Retinex

Retinex是一种常用的建立在科学实验室和科学分析基础上的图像增强方法。Retinex理论的基础理论是物体的颜色是由物体对长波(红色)、中波(绿色)、短波(蓝色)光线的反射决定的,而不是由反射光强度的绝对值来决定的,物体的色彩不受光照非均匀性的影响,即具有一致性,即Retinex是以色感一致性为基础的。

动机

现状

  • 在弱光场景下检测物体是一个持久的挑战,因为在强光数据上训练的检测器在弱光上表现出显著的性能下降,这是由于能见度造成的。
  • 以前的方法通过探索图像增强或使用真实弱光图像数据集的目标检测技术来缓解这个问题。

问题

  • 收集和标注弱光图像的固有困难阻碍了进展。

贡献

  • 利用zero-shot昼夜域自适应来增强弱光目标检测,旨在将检测器从强光场景推广到弱光场景,而无需真实的弱光数据。
  • 设计了一个反射率表示学习模块,以学习模块基于Retinex的图像照明不变性,并采用精心设计的照明不变性强化策略。
  • 引入了交互式重分解一致性过程来改进原始Retinex图像分解过程,方法是执行两次连续的图像分别并引入重分解一致性损失。

方法

  • 利用一个受物理启发的低照度合成管道来生成合成的低光图像,并与原始良好照明图像形成配对。
  • 重新审视了低级视觉中的Retinex理论用于高级检测任务,通过将低光图像分解为域不变和域特定信息,其中只有前者应保留以学习可泛化的检测器。因此在已建立的目标检测管道的基础上构建了DAI-Net。
  • 提出了一种反射率表示学习模块作为额外的解码器。此模块从良好照明图像和合成低光图像中解码与反射率相关的照度不变信息。它通过预先训练的Retinex分解网络产生的伪真实值进行优化,并通过专门设计的照度不变强化策略进行强化。
  • 设计了一种交换-重分解-一致性程序来改进基于Retinex的图像分解过程。它通过交换分解后的良好照明/低光反射率来重建图像,然后重新分解它们,依次执行两次图像分解。引入了重分解一致性损失,以促进两次分解中产生的反射率之间的一致性,从而学习到的反射率表示稳定且准确。

模型结构:
在这里插入图片描述


http://www.kler.cn/a/288172.html

相关文章:

  • RK3588 C++ 多线程运行
  • Qt文件目录操作
  • java:接口,抽象,多态的综合小练习
  • 智慧建造-运用Trimble技术将梦幻水族馆变为现实【上海沪敖3D】
  • C++静态成员
  • Mysql篇-三大日志
  • 力扣229题详解:求众数 II 的多种解法与模拟面试问答
  • ELK日志服务收集SpringBoot日志案例
  • 【每日刷题】Day106
  • CentOS 安装 NVIDIA 相关软件包时出现依赖问题
  • 四层神经网络,反向传播计算过程;四层神经网络中:y的函数公式是什么
  • MySQL的事务认识
  • 传输层(TCP、UDP、RDT详解)
  • 视频智能分析打手机检测算法安防监控打手机检测算法应用场景、算法源码、算法模型介绍
  • 计算机网络(一) —— 网络基础入门
  • JavaScript 在 VSCode 中的开发体验
  • 【数据结构】二叉搜索树的功能实现详解
  • 无人机之发动机篇
  • 谷歌的 GameNGen:无需游戏引擎,人工智能模拟 “毁灭战士“,开辟新天地
  • 24.9.1(康托展开)
  • 构建高可用的微服务架构:Spring Cloud Consul与负载均衡
  • 【C++学习笔记】预处理指令
  • 三级_网络技术_56_应用题
  • 如何本地搭建Whisper语音识别模型|语音识别|本地部署
  • C#中的ORM和EF框架
  • RK3568 驱动RTC 使用