当前位置: 首页 > article >正文

AODNet

【20231117】读研期间没有对阅读的文章进行总结,没想到毕业反而有了机会。即日起会对阅读过的文章要点进行梳理记录,希望这一习惯能够坚持下去。
学术的角度:看论文要学习作者如何逻辑严谨的自证
落地的角度:只用看以下六点,创新点是什么、设计思路是什么、用了什么数据、达成什么效果(比前人好多少)、有没有代码、能否复现

ICCV2017、微软亚研院、有代码

Li B, Peng X, Wang Z, et al. Aod-net: All-in-one dehazing network[C]//Proceedings of the IEEE international conference on computer vision. 2017: 4770-4778.
GitHub - weberwcwei/AODnet-by-pytorch: Image Dehaze, Pytorch, An All-in-One Network for Dehazing, AOD-Net

GitHub - walsvid/AOD-Net-PyTorch: Pytorch implementation of AOD-Net : All-in-One Network for Dehazing - ICCV2017

1、Abstract

BR:摘要真的提炼了文章最最最核心的要点,看懂它等于看懂文章 90% 的内容。

  1. reformulate atmospheric scattering model
  2. directly generates the clean image through a light-weight CNN

2、Introduction

BR:以往方式的不足是什么,作者最大的创新是什么。

  1. However, the estimation is not always accurate, and some common pre-processing such as guildfiltering or softmatting will further distort the hazy image generation process [8], causing sub-optimal restoration performance. Moreover, the non-joint estimation of two critical parameters, transmission matrix and atmospheric light,may further amplify the error when applied together.
  2. the major novelty of AOD-Net as the first to optimize the end-to-end pipeline from hazy images to clean images, rather than an intermediate parameter estimation step.

2.1 It is trained on synthesized hazy images, and tested on both synthetic and real natural images.——用的合成有雾图像做训练,论文实验数据和项目落地能一样吗、差距到底会有多大?

2.2 用的评价指标:PSNR、SSIM、视觉效果

2.3 As a lightweight model, AOD-Net has achieved a fast processing speed, costing as low as 0.026 second to process one 480 × 640 image with a single GPU——什么 GPU,26ms 是落地可以接受的速度吗?落地时延的要求是多少?TBD

3、Related Work

BR:通常不需要看这部分内容,记录是因为要做传统方法和深度学习方法的梳理总结。

3.1 传统方法去雾

  1. [23] 通过最大化局部对比度来消除雾霾。
  2. [6] 提出了一种通过估算景物反照率的物理真值方法。
  3. DCP [8],[24] 发现了有效暗信道先验(DCP) 来更可靠地计算传输矩阵。
  4. BCCR [12] 进一步加强了边界约束和上下文正则化,以获得更清晰的恢复图像。
  5. ATM [22] 提出一种自动恢复大气光的加速方法。
  6. CAP [32] 开发了一种颜色衰减先验,并对朦胧图像建立了场景深度的线性模型,然后以监督的方式学习模型参数。

3.2 深度学习方法去雾

  1. [17] MSCNN 多尺度CNN,首先生成一个粗尺度的传输矩阵,然后对其进行细化
  2. [3] 提出了一种可训练的端到端介质传输估计模型,称为DehazeNet。它以模糊图像为输入,输出其传输矩阵结合经验规则估计的全球大气光,通过大气散射模型恢复无雾图像。

上述方案的特点
基于一个认知:要想从有雾图中恢复干净的图片,准确估计介质传输图是关键。(环境光单独计算)
不足:尽管思路是直观且有物理基础的,该方法不直接测量或最小化重建畸变产生次优的图像恢复质量可能性增大,因为每个单独估计步骤中的误差将累积并可能相互放大。

3.3 AODNet

  1. 本文的 AOD-Net 直接输出去雾干净的图像,没有任何中间步骤估计参数。与 [3] 从模糊图像到传输矩阵的端到端学习不同,AOD-Net的完全端到端构建弥合了有雾图像和干净图像之间的最终目标差距

上述方案的特点
基于一个认知:物理模型可以用一种“端到端”的方式来表述,所有的参数都可以用一个统一的模型来估计。

4、Method

BR:放几组公式说明作者的设计思路。坦白说,从我的思维逻辑这些公式包括思路说明更像是实验验证可行后找的解释。实验确实在证明方法的有效性,但写文章更像是一种“自圆其说”,逻辑严谨的自证。

在这里插入图片描述

在这里插入图片描述
BR:作者将求解过程转变为求 K(x) 的过程

在这里插入图片描述

  1. Since K (x) is dependent on I (x), we then aim to build an input-adaptive deep model, and train the model by minimizing the reconstruction errors between its output J (x) and the ground truth clean image I(x).
  2. To justify why jointly learning t(x) and A in one is important, we compare the two solutions in experiments (see Section 4 for the synthetic settings). As observed in Figure 3, the baseline tends to overestimate A and cause overexposure visual effects.
  3. AOD-Net clearly produces more realistic lighting conditions and structural details, since the joint estimation of 1/t(x) and A enables them to mutually refine each other. In addition, the inaccurate estimate of other hyperparameters (e.g., the gamma correction), can also be compromised and compensated in the all-in-one formulation.

Results

客观数据对比

the subjective visual quality??

dataset

the indoor NYU2 Depth Database [21]

the Middlebury stereo database [19, 18, 9]

Thinking

  1. 作者在related work中,段落前黑体标注重点,这非常友好!
  2. 不用看他说的天花乱坠的概念。你就看它提不提供代码,不提供的话不用深入看它怎么实现的,留个印象即可。
  3. 看用的数据集和评价指标!!
  4. 我无法用图二主观判断得出本文方法好的依据。

1、传统的去雾方法+实现原理+优缺点+性能指标

读图环节

看图说话,描述每幅图作者试图在论证什么。

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述


在这里插入图片描述
在这里插入图片描述


http://www.kler.cn/a/132352.html

相关文章:

  • 儿童玩具安全检测GB6675标准详细介绍
  • SSD固态硬盘删除文件基本无法恢复
  • Matplotlib | 理解直方图中bins表示的数据含义
  • R语言基础入门详解
  • leetcode 扫描线专题 06-leetcode.836 rectangle-overlap 力扣.836 矩形重叠
  • SD模型微调之Textual Inversion和Embedding fine-tuning
  • 【docker启动的Jenkins时,遇到时区问题处理】
  • vscode编写verilog的插件【对齐、自动生成testbench文件】
  • SQLMAP --TAMPER的编写
  • 记录一些涉及到界的题
  • 字符串函数详解
  • 重温《Unix设计哲学》
  • Leetcode——最长递增子序列
  • RPC实现简单解析
  • 从零开始写一个APM监控程序(一)协议
  • 机器学习算法——集成学习
  • java代码的错误
  • Vue理解01
  • 微内核操作系统
  • 【Java 进阶篇】JQuery 遍历 —— 无尽可能性的 `each` 之旅
  • CSS-列表属性篇
  • 世微 降压恒流驱动IC 景观亮化洗墙灯舞台灯汽车灯LED照明 AP5199S
  • 【MATLAB源码-第82期】基于matlab的OFDM系统载波频移偏差(CFO)估计,对比三种不同的方法。
  • 每日一练 | 华为认证真题练习Day132
  • 数据库的基本操作
  • CV计算机视觉每日开源代码Paper with code速览-2023.11.14