线框检测:End-to-End Wireframe Parsing【方法解读】
目录
-
- 概述
- 摘要:
- 1. 引言
- 2. 相关工作
- 3. 方法
-
- 3.1. 数据表示
- 3.2. 整体网络架构
- 3.3. 骨干网络
- 3.4. 结点提议模块
- 3.5. 线采样模块
- 3.6. 线验证网络
- 4. 实验
- 5. 补充材料
概述
《End - to - End Wireframe Parsing》是一篇由Yichao Zhou等人撰写的关于端到端线框解析的论文。文章提出了一种新的算法来检测图像中的线框,该算法是端到端可训练的,能够直接输出包含语义有意义和几何显著节点和线的矢量化线框。
- 研究背景和目标:
- 提取场景的高级几何特征对基于图像的3D重建具有重要意义,直线及其节点(线框)是组装场景3D结构的基本元素。
- 现有线框解析系统对于复杂场景的处理仍不足,本文旨在探索解决该问题的简洁有效方案,即学习以端到端可训练的方式对线框进行矢量化表示。
- 相关工作:
- Line Detection:传统线检测方法基于局部边缘特征,近期方法结合深度学习特征和线矢量化算法,但不提供关于节点和线连接的信息,限制了其在场景解析中的应用。
- Wireframe Parsing:[14]提出线框解析任务,但采用的两阶段过程阻碍了端到端训练的优势,本文基于单端到端可训练神经网络直接输出矢量化线框表示。
- Instance - level Recognition:本文方法受实例级识别框架