当前位置: 首页 > article >正文

论文阅读:RGBD GS-ICP SLAM

目录

概要

Motivation

整体框架流程

技术细节

小结


论文地址:[2403.12550] RGBD GS-ICP SLAM (arxiv.org)

代码地址:https://github.com/Lab-of-AI-and-Robotics/GS-ICP-SLAM


概要

RGBD GS-ICP SLAM 是一种结合通用迭代最近点算法(Generalized Iterative Closest Point, G-ICP)和3D高斯投影(3D Gaussian Splatting, 3DGS)的密集表示SLAM系统,旨在通过共享同一3D高斯地图提高SLAM性能。该方法通过在跟踪与映射过程间交换协方差信息,减少了冗余计算,提升了跟踪精度和地图质量,实现了最高107 FPS的实时性能。

Motivation

尽管基于3DGS的SLAM方法利用了高速渲染,但它们未能解决一个根本性问题:无法直接利用三维显式表示并通过二维图像渲染间接跟踪三维空间。即使大多数当前的基于3DGS的SLAM利用RGB-D数据,也忽视了显式表示的使用。

(1)提出了一个实时密集表示SLAM,结合了G-ICP和3DGS,实现了整个系统的极高速度(最高达107 FPS)和地图的优质性。

(2)通过将G-ICP用于跟踪,该系统积极利用三维信息,并显著减少了跟踪过程所需的时间。

(3)通过共享G-ICP和3DGS的协方差,并采用尺度对齐技术,实现了计算成本的减少和3DGS原始数据的快速收敛。

整体框架流程

系统概述。 系统的输入是RGBD帧。通过对当前深度图像进行降采样和重新投影来生成点云,并在GICP过程中利用它。在GICP过程中,从点云中创建源高斯,并通过将它们与目标高斯(这些高斯是3D GS地图的子集)对齐来估计当前相机姿态。如果当前帧被确定为关键帧或仅用于地图的关键帧,将源高斯添加到3D GS地图中作为新的基元。同时,在地图构建过程中,优化高斯与高斯的颜色和不透明度集,与跟踪过程同时进行。

  • 输入RGBD帧:系统输入RGBD帧并生成当前帧的点云。
  • G-ICP跟踪:使用G-ICP计算帧之间的协方差,通过最优变换矩阵对齐点云,实现相机位姿估计。
  • 关键帧选择:根据几何对应关系动态选择关键帧。
  • 3DGS映射:将选择的关键帧作为3DGS映射的一部分,优化高斯的坐标和协方差。
  • 并行优化:在跟踪的同时进行映射优化,保证系统性能。

技术细节

  • G-ICP跟踪:通过计算当前帧和地图的高斯协方差矩阵,找到最优位姿变换。通过最大似然估计计算出每帧的最优变换矩阵。
  • 3DGS映射:在映射过程中,3DGS将3D空间表示为高斯集合,通过光栅化方法加速渲染。跟踪过程中计算的协方差直接用于映射,避免了冗余计算。
  • 关键帧选择:根据当前帧与地图的几何对应关系选择关键帧,避免跟踪过程中误差积累​。报告的数值代表来自 Replica 数据集的八个场景的平均结果。当每 n 帧选择关键帧(以蓝色表示)时,跟踪准确性明显较低。相反,这篇文章的关键帧选择方法产生了最高的跟踪准确性。

在 Replica office4 上分离关键帧选择。 证明了少量跟踪关键帧可以产生准确的轨迹估计(案例1),而大量建图关键帧可以提高渲染性能(案例2)。因此,作者采用案例3,在不同的间隔时间内分别选择跟踪关键帧和映射关键帧。

  • 尺度对齐:通过在G-ICP跟踪中对帧的尺度进行正则化,保证高精度的位姿估计​。

不足

  • 噪声问题:该系统过度依赖深度信息,在处理真实环境中的深度噪声时,重建地图的质量受限
  • 图像质量权衡:为提高速度,系统在某些场景下可能牺牲一定的图像重建质量​。

优点

  • 高效计算:通过共享跟踪与映射过程中的高斯协方差,减少了冗余计算,大幅提升系统速度​。
  • 实时性能:系统的处理速度最高可达107 FPS,能够支持实时SLAM。
  • 准确跟踪:与传统方法相比,系统显著提高了相机位姿的估计精度,尤其是在复杂场景下​。

小结

RGBD GS-ICP SLAM 通过结合G-ICP与3DGS,实现了高效的跟踪和映射。该系统通过共享协方差信息和动态关键帧选择,提升了SLAM的性能和速度,同时在追求高效的同时仍保持了较高的地图重建质量。

文章提出了RGBD GS-ICP-SLAM,这是一种利用三维高斯表示进行高保真度空间表示的密集表示SLAM系统。作者证明了利用单一三维高斯地图进行跟踪和建图的G-ICP和3DGS的融合可以产生相互的好处。跟踪和建图过程之间的高斯交换与尺度对齐最小化了冗余计算并构建了一个高效的系统。此外,动态关键帧选择方法提高了跟踪和建图性能。通过广泛的实验,所提出的方法在空间表示、相机位姿估计和总系统速度方面呈现出最先进的性能。


http://www.kler.cn/a/300610.html

相关文章:

  • mysql_real_connect的概念和使用案例
  • 【机器学习实战中阶】音乐流派分类-自动化分类不同音乐风格
  • Springboot Redisson 分布式锁、缓存、消息队列、布隆过滤器
  • HarmonyOS NEXT应用开发边学边玩系列:从零实现一影视APP (四、最近上映电影滚动展示及加载更多的实现)
  • 用户中心项目教程(二)---umi3的使用出现的错误
  • windows 远程链接 Ubuntu 图形界面
  • 【题解】CF2008G
  • 解锁数据的秘密武器:PCA带你走进降维新世界
  • 《黑神话:悟空》被“罕见”网络攻击联想个人网络和数据安全防范
  • Java 后端接口入参 - 联合前端VUE 使用AES完成入参出参加密解密
  • AIGC大模型扩图:Sanster/IOPaint(4)
  • 大模型岗位招聘数据分析及可视化
  • 免费爬虫软件“HyperlinkCollector超链采集器v0.1”
  • Day8 | Java框架 | Maven
  • 【EI稳定,马来亚大学主办】2024年计算机与信息安全国际会议(WCCIS 2024,9月27-29)
  • Mac M芯片上安装统信UOS 1070arm64虚拟机
  • React实现虚拟列表的优秀库介绍
  • pyecharts可视化数据大屏【详细教程】
  • Flutter之SystemChrome全局设置
  • hpl 的测试配置文件 HPL.dat 的内容说明
  • Eclipse WEB项目在IDEA中使用
  • 《系统安全架构设计及其应用》写作框架,软考高级系统架构设计师
  • RabbitMQ练习(AMQP 0-9-1 Overview)
  • github actions CICD简单使用案例
  • uniapp 各个端接入腾讯滑动行为验证码示例
  • 毕业论文word页眉页脚和页码的问题