当前位置：首页 > article >正文

【论文速看】DL最新进展20241112-3D、异常检测、车道线检测

article 2025/2/22 16:36:33

【3D】

[2024] WildOcc: A Benchmark for Off-Road 3D Semantic Occupancy Prediction

论文链接：https://arxiv.org/pdf/2410.15792

代码链接：https://github.com/LedKashmir/WildOcc

3D语义占用预测是自动驾驶的重要组成部分，专注于捕捉场景的几何细节。非道路环境富含几何信息，因此适用于3D语义占用预测任务来重建这些场景。然而，大多数研究集中在道路环境上，由于缺乏相关的数据集和基准，很少有方法专门为非道路3D语义占用预测设计。为了弥补这一空白，文中引入了WildOcc，据我们所知，这是第一个为非道路3D语义占用预测任务提供密集占用注释的基准。本文提出了一个地面真实生成pipeline，该管线采用从粗到细的重建方法以实现更真实的结果。此外，作者引入了一个多模态3D语义占用预测框架，该框架在体素级别融合了来自多帧图像和点云的时空信息。此外，还引入了一种跨模态蒸馏功能，它将几何知识从点云转移到图像特征中。

在这里插入图片描述
数据集介绍

实验结果

【异常检测】

[ECCV 2024] VL4AD: Vision-Language Models Improve Pixel-wise Anomaly Detection

论文链接：https://arxiv.org/pdf/2409.17330

代码链接：参考https://github.com/bytedance/fc-clip

语义分割网络在假设数据独立同分布的情况下取得了显著的成功。然而，这些网络通常难以检测未知语义类别的异常，因为它们通常只在有限的视觉概念集上进行训练。为了解决这个问题，异常分割通常涉及对离群样本进行微调，这需要额外的数据收集、标注和模型重新训练的努力。为了避开这种繁琐的工作，文中采取了不同的方法，提出将视觉-语言（VL）编码器纳入现有的异常检测器中，以利用语义广泛的VL预训练来提高离群感知能力。此外，作者提出了一种新的评分函数，通过文本提示实现无需数据和训练的离群监督。由此产生的VL4AD模型包括最大对数概率提示集成和类别合并策略，在广泛使用的基准数据集上实现了具有竞争力的性能，从而展示了视觉-语言模型在像素级异常检测中的潜力。

在这里插入图片描述

实验结果
在这里插入图片描述

在这里插入图片描述

【车道线检测】

[2024] Polar R-CNN: End-to-End Lane Detection with Fewer Anchors

论文链接：https://arxiv.org/pdf/2411.01499

代码链接：https://github.com/ShqWW/PolarRCNN

车道检测是自动驾驶中一项关键且具有挑战性的任务，特别是在现实世界的场景中，交通车道可能狭窄、漫长，并且经常被其他车辆遮挡，这使得检测工作变得更加复杂。现有的基于锚点的方法通常依赖于先验车道锚点来提取特征，并随后细化车道的位置和形状。虽然这些方法取得了高性能，但手动设置先验锚点是繁琐的，而要确保在不同数据集上有足够的覆盖范围，通常需要大量的密集锚点。此外，使用非极大值抑制（NMS）来消除冗余预测使得在现实世界中的部署变得复杂，并且在复杂场景中表现不佳。文中提出了Polar R-CNN，一种端到端的基于锚点的车道检测方法。通过结合局部和全局极坐标系，Polar R-CNN促进了灵活的锚点建议，并显著减少了所需锚点的数量，同时不妥协性能。通过引入一个带有启发式结构的三元头，支持无NMS范式，从而提高了在密集场景中的部署效率和性能。该方法在五个流行的车道检测基准上取得了具有竞争力的结果，包括Tusimple、CULane、LLAMAS、CurveLanes和DL-Rai，同时保持了轻量级设计和简单的结构。

在这里插入图片描述