当前位置: 首页 > article >正文

自动驾驶 3DGS 学习笔记

目录

street_gaussians

gsplat依赖项

运行报错:

python>=3.9

SGD: Street View Synthesis with Gaussian Splatting and Diffusion Prior 

差分高斯光栅化 diff-gaussian-rasterization


street_gaussians

https://github.com/zju3dv/street_gaussians

gsplat依赖项

sudo apt install ninja-build

sudo apt-get install libglm-dev

编译3dgs的源代码成功,后面的版本不匹配,不能调用。

linux安装成功:

pip install git+https://github.com/XingtongGe/gsplat.git

运行报错:

ModuleNotFoundError: No module named 'gsplat.rendering'

python>=3.9

pip install git+https://github.com/Mxbonn/gsplat-pytorch.git

SGD: Street View Synthesis with Gaussian Splatting and Diffusion Prior 

解说:

街景的新视角合成对于模拟的重要性,并介绍了目前实现此目标的主流技术是神经渲染,例如神经辐射场(NeRF)和三维高斯飞溅(3DGS)。然而,在处理街景时,当前方法在与训练视角明显偏离的视点上保持渲染质量时存在困难。为了解决这个问题,文章提出了一种新方法,通过利用扩散模型的先验以及补充的多模态数据,增强了3DGS的能力。实验结果表明,这种方法相对于当前最先进模型更有效,并展示了在渲染更广泛视角的图像方面的优势。

2.1 微调扩散模型

本节介绍了一种用于微调扩散模型的新方法,该方法专门针对驾驶数据进行微调。驾驶数据按顺序收集,因此我们可以轻松地确定任何新视角的最接近的前后帧。作者将这些相邻帧的图像作为参考图像,因为它们提供了有价值的上下文信息。此外,360°激光雷达点云使我们能够为参考帧和新视图推导深度图,从而全面理解跨视角的相对空间信息。通过微调扩散模型,作者引导它从上下文图像中学习应该存在的内容,以及从深度信息中学习对象之间的空间关系。微调分为两个阶段:第一阶段是基于图像的扩散模型,第二阶段是添加深度控制网络。第一阶段旨在使扩散模型从相邻帧的图像中学习场景的高级信息,而不包括姿态信息。第二阶段旨在利用3D信息控制模型以实现更准确的图像生成。通过这两个阶段的微调,作者的方法在自动驾驶场景中展现出了优异的性能。 作者:3D视觉工坊 https://www.bilibili.com/read/cv34267043/ 出处:bilibili

开源地址是错的

GitHub - Leeiieeo/AG-Pose: CVPR2024: Instance-Adaptive and Geometric-Aware Keypoint Learning for Category-Level 6D Object Pose Estimation

原理介绍

全面超越!开源!百度最强SOTA:基于扩散模型的3DGS! - 哔哩哔哩

差分高斯光栅化 diff-gaussian-rasterization

/mnt/pfs/users/lbg/code/1-drivestudio/third_party/diff-gaussian-rasterization

编译:

diff-gaussian-rasterization

python setup.py install


http://www.kler.cn/news/327805.html

相关文章:

  • 接口性能优化日记
  • Java高级Day51-apacheDBUtils
  • mybatis-plus与xml结合使用
  • 17【Protues单片机仿真】基于51单片机的太阳能智能谷物翻晒机器人
  • Vue 技术进阶 day2 数据监视的原理、其他内置指令、自定义指令、生命周期、组件化、VueComponent构造函数
  • 第十三届蓝桥杯真题Java c组C.纸张尺寸(持续更新)
  • leetcode力扣刷题系列——【座位预约管理系统】
  • Vue3实现mqtt的订阅与发布
  • 【论文解析】基于开源 Matrix 指令集扩展(矢量点积)的高性能 RISC-V 处理器“香山”(nanhu 版本)的 LLM 加速的研究
  • 828华为云征文|部署多功能集成的协作知识库 AFFiNE
  • mysql如何不使用窗口函数,去统计出入库情况
  • 全视通智慧养老护理呼叫求助,打造安心舒适的养老生活
  • JavaScript 可视化案例详解
  • 了解Webpack并处理样式文件
  • 黑马头条day5- 延迟任务精准发布文章
  • NVIDIA Hopper 架构深入
  • spring cache,Spring data redis
  • OpenCV视频I/O(5)视频采集类VideoCapture之从视频流中获取下一帧的函数grab()的使用
  • 【mod分享】山脊赛车无限高清重置mod,替换高清贴图和光影材质,可实现reshade光追
  • Oracle(145)如何进行数据库的日常维护?
  • Map put的过程
  • ELK--收集日志demo
  • 清美项目 vue总结
  • PPT 快捷键使用、技巧
  • 卷积神经网络(CNN)的计算量和参数怎么准确估计?
  • 独立样本t检验及其案例分析
  • 代码训练营 day17|LeetCode 235,LeetCode 701,LeetCode 450
  • 线性方程组的迭代方法
  • IP协议讲解
  • 唱响红色志愿,赞歌献给祖国——杭州建德市庆祝中华人民共和国成立75周年联欢盛宴纪实