当前位置: 首页 > article >正文

激光雷达点云语义分割——Polarseg环境配置

目录

一、PolarNet: An Improved Grid Representation for Online LiDAR Point Clouds Semantic Segmentation

概要

Motivation

系统框架

二、Polarseg环境配置

三、小结


论文地址:[2003.14032] PolarNet: An Improved Grid Representation for Online LiDAR Point Clouds Semantic Segmentation

代码地址:https://github.com/edwardzhou130/PolarSeg.git

一、PolarNet: An Improved Grid Representation for Online LiDAR Point Clouds Semantic Segmentation

概要

自动驾驶系统对细粒度感知的需求使得单扫描激光雷达在线语义分割成为研究热点。尽管已有新兴的数据集和技术进展,但由于以下三个原因,在线语义分割仍面临挑战:

  1. 需要在有限的硬件下实现近实时延迟;
  2. LiDAR点云在空间分布上不均匀且存在长尾现象;
  3. 增加了极细粒度的语义类。

为了解决这些挑战,本文提出了一种新的LiDAR特定的分割算法——PolarNet,该算法利用极坐标系表示代替传统的球面或鸟瞰图投影,以更好地处理点云数据的长尾分布。作者发现,基于极坐标网格的编码方案在城市LiDAR数据集上能够显著提高 mIoU,同时保持近乎实时的吞吐量。

Motivation

  提出极鸟瞰图表示法和环链接卷积,在SemanticKITTI,A2D2 和Paris-Lille-3D 数据集上验证了方法。结果表明,在仅使用参数和MAC的1/3的平均交叉-联合(mIoU)评估指标上,方法分别比现有方法高出2.1%,4.5%和3.7%。工作贡献概括如下:

•提出了一种更合适的LiDAR扫描表示形式,它考虑了点的不平衡空间分布。

•展示的PolarNet网络经过极网格数据表示法的端到端训练,以较低的计算成本超越了基于公共基准的先进方法。

•与其他表示法(如笛卡尔BEV)相比,使用极坐标网格对基于不同主干分段网络的语义分割性能进行了全面分析。

系统框架

1、极化鸟瞰图

优点

  • 点云均匀分布:由于极坐标系统的特性,点云在网格单元内的分布更加均匀,尤其是在靠近传感器的区域。
  • 更少的错误分类:与笛卡尔BEV相比,极化BEV网格单元中较少出现错误分类,特别是小物体分类问题。

基于LiDAR扫描俯视图出现的环形结构,作者展示了图3所示的Polar分区,取代了图3中的笛卡尔分区。具体地,首先以传感器的位置为原点,计算XY平面上每个点的方位角和半径,而不是对笛卡尔坐标系中的点进行量化。然后将点云分配给根据量化方位角和半径确定的网格单元。

极化BEV有两个好处,首先,它可以更平均地分配点。通过统计SemanticKITTI数据集拆分的验证集,发现每个极点栅格像元靠近传感器时的点数远小于笛卡尔BEV中的点数。因而,用于密集区域的网格的表示更精细。在相同数量的网格单元中,传统的BEV网格单元平均为0.7±3.2点,而极性BEV网格单元平均为0.7±1.4点。标准偏差之间的差异表明,总体而言,这些点在极地BEV网格上分布更均匀。

极化BEV的第二个好处是,更平衡的点分布减轻了预测变量的负担。由于将2D网络输出重塑为体素以进行点预测,因此不可避免地,某些具有不同真实值标签的点将分配给同一体素。而且其中有些无论如何都会被错误分类。使用笛卡尔BEV,每个网格单元中平均98.75%的点共享相同的标签。在极化BEV中,这一数字跃升至99.3%。这表明由于空间表示特性,极化BEV中的点较少遭受错误分类。考虑到小物体更有可能被体素中的多数标签所淹没,这种0.6%的差异可能会对最终的mIoU产生更深远的影响。研究mIoU的上限表明,笛卡尔BEV的mIoU达到97.3%。极化BEV达到98.5%。极化BEV的较高上限可能会提高下游模型的性能。

2、环形卷积

无需随意为每个网格手工绘制特征,而是使用固定长度的表示形式捕获每个网格中的点分布。它是由可学习的简化PointNe h和最大池化产生的。该网络仅包含完全连接的层,批处理规范化和ReLu层。

实验结果

实验结果表明,PolarNet在多个标准数据集上取得了显著的性能提升。具体来说:

  • 在SemanticKITTI数据集上,PolarNet的mIoU提高了2.1%,在A2D2数据集上提高了4.5%,在Paris-Lille-3D数据集上提高了3.7%。
  • 极坐标网格的表示不仅提高了分割精度,还使得模型在处理不同密度的点云数据时更加高效。
优点
  • 点云均匀分布:极坐标网格能使点云数据在空间分布上更加均匀,减少了因点云不均衡而导致的分割误差。
  • 计算效率:在保持较高分割精度的同时,PolarNet的计算开销较低,适合在实时或近实时的自动驾驶系统中使用。
  • 小物体识别:极坐标网格帮助减少了小物体被误分类的概率,提升了整体的分割效果。

二、Polarseg环境配置

git clone https://github.com/edwardzhou130/PolarSeg.git
cd PolarSeg
conda create -n polarnet python=3.7
conda activate polarnet

2.eorr

在安装torch_scatter之前,需要先安装PyTorch和Torch Geometric。确保你的环境中已经正确安装了这些库。可以使用以下命令安装:

    pip install torch torchvision
    conda install pytorch torchvision torchaudio -c pytorch

对于CUDA支持,需要确保你的PyTorch版本与CUDA版本兼容。你可以在PyTorch官网查看支持的CUDA版本。

then

3.

Download Velodyne point clouds and label data in SemanticKITTI dataset [here](http://www.semantic-kitti.org/dataset.html#overview).

4.Data file structure should look like this:

```
./
├── train_SemanticKITTI.py
├── ...
└── data/
    ├──sequences
        ├── 00/           
        │   ├── velodyne/    # Unzip from KITTI Odometry Benchmark Velodyne point clouds.
        |   |    ├── 000000.bin
        |   |    ├── 000001.bin
        |   |    └── ...
        │   └── labels/     # Unzip from SemanticKITTI label data.
        |       ├── 000000.label
        |       ├── 000001.label
        |       └── ...
        ├── ...
        └── 21/
        └── ...
```

python train_SemanticKITTI.py

三、小结

  • 该论文通过引入极坐标网格表示法和环形卷积有效解决了LiDAR点云数据在空间分布不均的问题,并显著提升了语义分割的性能。
  • 通过使用PolarSeg环境配置步骤,你可以轻松地搭建并运行PolarNet在SemanticKITTI数据集上的实验。

http://www.kler.cn/a/461070.html

相关文章:

  • 深入解析爬虫中的算法设计:提升效率与准确度
  • Java高频面试之SE-08
  • 《深度学习梯度消失问题:原因与解决之道》
  • 实现单例模式的五种方式
  • springboot集成qq邮箱服务
  • DjangoORM字段参数、常用字段类型及参数、模型和表单验证器详解
  • 深入理解 MVCC:多版本并发控制详解
  • Android 系统 AlarmManager 系统层深度定制
  • Qt信号的返回值
  • Xpath学习
  • AirLLM: 分层推理在低内存硬件上的应用
  • k8s 部署meilisearch UI
  • CentOS 7系统 OpenSSH和OpenSSL版本升级指南
  • 基于编程语言的知识图谱表示增强大模型推理能力研究,一种提升LLM推理准确率达91.5%的结构化数据方法
  • 复合选择器,CSS特性,emmet写法,背景属性,显示模式
  • 快递行业的创新引擎,近屿智能带您探索AI的无限可能
  • AI开发 - 算法基础 递归 的概念和入门(二)汉诺塔问题 递归的应用和使用注意 - Python
  • 高阶数据结构之并查
  • 进程操作与管理实战指南
  • 图论求解平面TSP问题算法复现
  • 《脑网络与智力:基于图神经网络的静息态fMRI数据研究》|文献速递-视觉大模型医疗图像应用
  • 数据结构(链式队列)
  • 开源模型应用落地-FastAPI-助力模型交互-进阶篇-中间件(四)
  • 知识库搭建实战一、(基于 Qianwen 大模型的知识库搭建)
  • [Linux] 服务器CPU信息
  • 2024-12-31-devkit-pipeline