理想发布的下一代自动驾驶架构MindVLA是什么?
理想汽车发布的下一代自动驾驶架构MindVLA是基于“机器人大模型”理念设计的全新技术体系,旨在通过融合空间智能、语言智能和行为智能,将汽车从交通工具转变为“专职司机”。以下是其关键技术及自动驾驶架构的演进分析:
一、MindVLA的关键技术
-
端到端+VLM双系统架构
采用“视觉-语言-行为”(VLM)融合的端到端模型,直接从原始传感器数据生成驾驶决策,减少传统模块化流程的延迟和信息损失。- 3D高斯中间表征:通过自监督学习构建高效环境感知模型,能多尺度、多粒度表达3D几何信息,提升对复杂场景的理解能力。
- MoE架构与稀疏注意力:利用混合专家模型(MoE)和稀疏注意力机制优化计算效率,实现车端实时推理。
-
逻辑推理与行为生成
引入语言模型(LM)的逻辑推理能力,使系统能快速响应突发场景