当前位置: 首页 > article >正文

自动驾驶---Tesla FSD Version 13

1 前言

        关于特斯拉,笔者之前写过不少博客,曾在《自动驾驶---Tesla之FSD简介》中介绍过12.4版本的更新,在《自动驾驶---Tesla的自动驾驶技术进化史(Perception&Planning)》中详细介绍过Tesla的技术路线,也曾分析过特斯拉这个公司《行业分析---马斯克的Tesla》。

        有兴趣的读者朋友可以了解上面的信息,特斯拉在2024年11月底面向部分用户推送了V13版本的FSD,大版本的更新必然带着功能以及性能上的优化,本篇博客就向各位读者介绍相关进展。

2 FSD V13.2

        特斯拉 FSD V13 版本是特斯拉自动驾驶系统的一次重大更新,带来了多方面的改进和新功能:

2.1 功能方面

  • 一键启动FSD

    • 从停车状态一键启动FSD,增加了使用的便捷性。
    • 任何场景。
  • 集成的泊车能力

    • 整合了无人泊车、倒车和停车功能,提高了自动泊车的能力。
    • 正式打通起点和终点的泊车。

2.2 性能提升

        性能提升主要从三个方面的表现来进行说明,首先时原始数据,对原始数据的精度进行提升对感知能力是非常有帮助的,包括摄像头清洁,相机遮挡,分辨率以及音频信号的使用;然后是模型相关,数据规模的扩大能提高模型的能力,同时优化了网络模型以及整个模型的延时;最后是速度和方向盘稳定性的体验提升。

(1)原始数据

  • 相机清洁与遮挡处理

    • 提升了相机清洁功能的效果,确保了摄像头的清晰度。
    • 改善了相机遮挡问题的处理能力,提高了系统的稳定性和可靠性。
  • 视频输入

    • 利用 AI4 摄像头的原生分辨率,相比之前 HW3 的 1.2 兆像素,AI4 摄像头分辨率达到 5.44 兆像素,图像清晰度大幅提升。

    • 帧率也提升到 36Hz,这使得车辆能够更流畅地显示画面,并且可以更早、更精确地识别物体,为自动驾驶提供更准确的视觉信息,在识别道路标志、障碍物以及其他车辆等方面表现更出色。

  • 音频输入处理
    • 首次加入了对音频信号的识别功能,车辆可以识别警笛等紧急车辆的声音信号,即使在视线受阻的情况下,也能提前感知到紧急车辆的靠近,增强了车辆在应对突发情况时的反应能力。

(2)模型相关

  • 数据规模扩大
    • 训练数据规模增加了 4.2 倍,这意味着系统有更多的实际交通场景数据可供学习,能够更好地理解各种复杂的驾驶情况,从而做出更准确的决策。
  • 模型增大与能力提升:AI 模型大小增加了三倍,上下文长度也增加了三倍。模型规模的扩大让 FSD 13 拥有更多的背景知识和信息可参考,在处理复杂驾驶场景时能够进行更详细的分析,提高自动驾驶的安全性和响应能力。得益于特斯拉的 Cortex 训练超级集群,其训练计算能力也得到了 5 倍的提升。
  • 神经网络架构

    • 采用了专为AI4(特斯拉的第四代人工智能计算硬件Autopilot Hardware 4.0)设计的原生输入和神经网络架构。

  • 降低延迟

    • 光子到控制的延迟减少了2倍,提高了系统的响应速度。

(3)“规控”方面的更新

  • 控制器重新设计

    • 为了更平滑、更准确的跟踪,对控制器进行了重新设计(如果大模型覆盖到控制层面,这里和大模型似乎有冲突,因此笔者猜测特斯拉FSD的模型输出也只是到轨迹层面)。
  • 动态路线规划

    • 能够动态规划路线,绕过道路封闭区域,并在检测到时在路线上显示更新。
  • 速度档案

    • 控制器重新设计,实现了更流畅、更准确地跟踪物体,让车辆的操控更加自然,驾驶体验更接近人类驾驶员的操作,提升了整体驾乘的舒适度。
  • 防碰撞优化

    • 对防碰撞的奖励预测进行了优化,使车辆在面临潜在碰撞风险时能够更及时地做出反应,进一步提高了自动驾驶的安全性。

        针对本次更新,笔者有两点想要表达的观点。第一点,目前国内的车位到车位功能都需要用户提前自驾走一遍停车路线,才能激活车位到车位功能,这里涉及到的就是停车场的建图。

        “规控”上除了控制的更新,其中绕行施工区域应该是基本能力,不知道相比较之前有什么优化(后续笔者会再去验证),然后就是安全兜底的优化。

2.3 场景表现

        最近一段时间,笔者看了不少特斯拉最新版本的视频,两个场景下的表现印象深刻,首先式停车场的表现,另一个式特殊天气:比如雪天,大雾等。

(1)停车场

        特斯拉 FSD V13本次更新,最为大家津津乐道的功能便是停车场的驶入和驶出,可以实现困难车位的掉头泊入。

        之前的博客中简单提过,国内的记忆泊车、代客泊车或者车位到车位功能都需要用户自己开车点击路线记忆提前走一遍停车路线(即使是近两个月多家公司发布的车位到车位功能,仍然需有这个依赖),这里有两个关键点:需要用户操作点击录制按钮,并开至相对应的停车位置。这个原理就是依赖人驾的路线,需要提前对驶出或者驶入的停车场进行建图,后续使用车位到车位功能时,再去调用行泊的能力(这里涉及到两个方面的能力:行车的能力,泊车的能力。行泊是否是同一个模型仍然值得商榷)。

        特斯拉的表现,并没有说需要人类司机手动录制停车轨迹并进行建图,而是可以直接从任意一个停车位出发,如果是路边停车位比较容易,那如果是复杂的停车场呢。如果有图能导航,那问题也不大,那如果没图没导航怎么开出去呢,如果是人类司机会不断的在停车场巡航尝试或者问路,但FSD 不可能问路,因此笔者推测,特斯拉后台会监测是否进入停车场相关区域,后台会建图(不需要人类司机进行任何操作),特斯拉暂时也不会泊入特定的停车位,但在下一个大版本中会给用户选择泊入哪个车位。

(2)雪天

        在雪后的马路上(有些路段没有车道线,路也不宽),会靠一侧行驶,路口防御性减速,即使没有看到车。并且整体车速不高,如果司机没有主动设置最大车速,车辆需要自主学习雪天的驾驶模式,如果每一个场景靠规则来限速是不太现实的,如果模型的训练数据集中包含雪天的人类司机驾驶数据,那么这个问题就比较简单了。

(3)雾天

        这种条件下其实涉及到感知的路线发展,通常人们普遍认为雾天的纯视觉方案可能比较受限,但如果通过算法模型的应用能把雾天的能见度扩大,那么视觉的能力自然会提升。目前国内的企业还是会选择激光雷达作为辅助,提升安全性,但看起来也是一个过渡方案,因为头部企业也开始了纯视觉方案的研发和量产,像小鹏汽车。

        如下图所示,特斯拉在大雾天行驶,车速能到50km/h,甚至比普通人类司机还激进了一些。

        总的来说,特斯拉 FSD 13 版本是一次全面的升级,在视觉感知、数据处理、功能丰富度以及驾驶体验等方面都有显著的提升,为实现更高级别的自动驾驶奠定了基础。

        实际表现和用户反馈  :

  • FSD 13.2版本在实际驾驶中的表现印象深刻,特别是在平滑合并和车道变换方面。
  • FSD 13.2在停车场的导航和泊车能力有显著提升,甚至能够自主倒车进入充电桩。

3 总结

        自从2022年之后,特斯拉并没有再进行过AI Day的活动,其自动驾驶路线也只有内部工程师,或者和特斯拉工程师有接触的同行才略知一二,截止到目前位置特斯拉是否真的已经实现一段式端到端仍然没有官方的说明。

        但FSD在V13的版本中,通过引入新的视频处理能力、提升数据处理和训练能力、降低系统延迟、改进用户界面和泊车能力,以及后续更新增加音频输入等功能,显著提高了自动驾驶系统的性能和用户体验。


http://www.kler.cn/a/462957.html

相关文章:

  • Qt|QWidget窗口支持旋转
  • mysql 忘记root密码 无密码登录系统 配置文件怎么改?
  • 【深度学习进阶】基于CNN的猫狗图片分类项目
  • 单片机串口控制
  • el-table 实现纵向多级表头
  • 机器学习之正则化惩罚和K折交叉验证调整逻辑回归模型
  • Java排序算法全解析
  • memcached的基本使用
  • arcgis模版空库怎么用(一)
  • 基于Java+SQL Server实现的(GUI)会展中心管理系统
  • Wndows bat将一个目录下所有子文件夹的路径导出到txt文本
  • Windows 安装 MySQL8(在已有MySQL 5.7 的情况下)
  • 【SQL Server】教材数据库(3)
  • 【Domain Generalization(2)】领域泛化在文生图领域的工作之——PromptStyler(ICCV23)
  • 爬虫基础之爬取表情包GIF
  • Pyqt+Opencv的练习
  • 【嵌入式硬件】嵌入式显示屏接口
  • CTFshow-pwn刷题
  • Mongodb日志报错too many open files,导致mongod进程down
  • 主数据驱动的数据治理框架
  • 探索 Yocto-Meta-OpenEuler:嵌入式开发的强大基石
  • [卫星遥感] 解密卫星目标跟踪:挑战与突破的深度剖析
  • OkHttp深度解析:请求流程、分发器机制、拦截器工作及TCP连接复用
  • 算法-Excel字母表转换成数字 26进制转换
  • Mono里运行C#脚本17—load_tables
  • ica1