当前位置: 首页 > article >正文

创新性融合丨卡尔曼滤波+目标检测 新突破!

2024深度学习发论文&模型涨点之——卡尔曼滤波+目标检测

卡尔曼滤波是一种递归算法,用于估计线性动态系统的状态。它通过预测和更新两个步骤,结合系统模型和观测数据,来估计系统状态,并最小化估计的不确定性。

在目标检测中,卡尔曼滤波可以用于预测目标下一时刻的位置和速度,然后利用观测数据(如摄像头捕获的图像)来校正预测,从而提高目标跟踪的准确性。

卡尔曼滤波与目标检测的结合可以有效解决跟踪过程中的干扰和遮挡问题,实现在运动较快、干扰较强和有遮挡情况下的高性能跟踪。

我整理了一些卡尔曼滤波+目标检测【论文+代码】合集,需要的同学公人人人号【AI创新工场】自取。

论文精选

论文1:

BoT-SORT: Robust Associations Multi-Pedestrian Tracking

BoT-SORT:稳健关联的多人跟踪

方法

结合运动和外观信息:提出了一种新的稳健跟踪器BoT-SORT,结合了运动和外观信息的优势。

相机运动补偿:引入相机运动补偿机制,以提高跟踪精度。

卡尔曼滤波器状态向量优化:优化卡尔曼滤波器状态向量,以实现更准确的框定位。

IoU和ReID融合:开发了一种新的方法,用于结合IoU距离矩阵和余弦距离矩阵,以实现检测和轨迹之间更稳健的关联。

图片

创新点

性能提升:BoT-SORT在MOT17和MOT20数据集上实现了80.5的MOTA、80.2的IDF1和65.0的HOTA,显著优于其他跟踪器。

相机运动补偿:通过相机运动补偿,提高了跟踪器在动态相机场景下的鲁棒性。

卡尔曼滤波器优化:通过优化卡尔曼滤波器状态向量,提高了框定位的准确性。

关联方法创新:通过IoU和ReID的融合,实现了更稳健的检测和轨迹关联,提高了跟踪的准确性。

图片

论文2:

FishMOT: A Simple and Effective Method for Fish Tracking Based on IoU Matching

FishMOT:基于IoU匹配的简单有效的鱼类跟踪方法

方法

基础模块:基于检测框之间的IoU进行目标关联,以处理鱼类形态变化。

交互模块:结合检测框和鱼类实体的IoU来处理遮挡问题。

重新查找模块:利用时空信息来克服复杂环境中检测器漏检导致的跟踪失败。

图片

创新点

性能提升:FishMOT在MOTA指标上实现了99.93%的准确率,显著优于其他鱼类跟踪方法。

计算复杂度降低:由于不需要复杂的特征提取或每个鱼类的身份分配,FishMOT减少了计算复杂度和内存消耗。

鲁棒性和泛化性:FishMOT在不同环境和鱼类数量下表现出色,显示出良好的鲁棒性和泛化性。

无需Kalman滤波器:FishMOT不需要Kalman滤波器来预测连续帧的检测框,进一步简化了跟踪流程。

图片

论文3:

SearchTrack: Multiple Object Tracking with Object-Customized Search and Motion-Aware Features

SearchTrack:具有对象定制搜索和运动感知特征的多目标跟踪

方法

对象定制搜索:为每个对象创建一个定制的全卷积搜索引擎,通过学习一组特定于对象的动态卷积权重。

运动感知特征:通过卡尔曼滤波器预测对象位置,并将预测的运动编码到运动感知特征中。

点基检测方法:基于CenterNet检测器,通过对象中心点进行检测。

动态搜索器:使用动态生成的卷积核来搜索特定对象。

图片

创新点

性能提升:SearchTrack在KITTI MOTS基准测试中实现了71.5%的HOTA(汽车)和57.6%的HOTA(行人),显著优于其他在线2D方法。

运动信息的重要性:通过将运动信息编码到特征图中,显著提高了关联准确性,特别是在非刚性行人类别中。

计算效率:由于每个帧只需要通过主干网络一次,显著减少了计算时间。

分割分支的协同作用:通过与分割任务的联合训练,跟踪性能得到了显著提升。

图片

论文4:

Multi-Modal Sensor Fusion and Object Tracking for Autonomous Racing

自动驾驶赛车的多模态传感器融合与目标跟踪

方法

模块化后期融合:提出了一种模块化的多模态传感器融合和跟踪方法,用于高速应用。

扩展卡尔曼滤波器(EKF):基于EKF融合异构检测输入以一致地跟踪周围物体。

延迟补偿:提出了一种新颖的延迟补偿方法,以减少感知软件延迟的影响,并输出更新的物体列表。

图片

创新点

鲁棒性验证:在AC@CES 2022的高速真实场景中验证了跟踪算法,证明了其在嵌入式系统上的鲁棒性和计算效率。

异构检测输入融合:能够融合来自不同传感器模态的检测输入,优化了跟踪性能。

延迟补偿效果:通过反向-前向积分实现了感知软件延迟的补偿,显著提高了跟踪精度。

图片



http://www.kler.cn/a/446635.html

相关文章:

  • 【网络云计算】2024第51周-每日【2024/12/17】小测-理论-解析
  • 《全面解析 QT 各版本:特性、应用与选择策略》
  • Qt同步读取串口
  • 【笔记】深度学习模型评估指标
  • 从0-1开发一个Vue3前端系统页面-9.博客页面布局
  • 【Rust自学】4.1. 所有权:栈内存 vs. 堆内存
  • C/C++语言基础--C++STL库之仿函数、函数对象、bind、function简介
  • 单元测试(C++)——gmock通用测试模版(个人总结)
  • Spring(三)-SpringWeb-概述、特点、搭建、运行流程、组件、接受请求、获取请求数据、特殊处理、拦截器
  • python实现word转html
  • AI大模型进一步推动了AI在处理图片、视频、音频、文本的等数据应用
  • 【新教程】非root用户给Ubuntu server设置开机自启服务-root用户给Ubuntu server设置开机自启服务
  • ArcGIS计算土地转移矩阵
  • 详细解释爬虫中的异常处理机制?
  • Rabbitmq实现延迟队列
  • Leetcode2545:根据第 K 场考试的分数排序
  • 26、基于SpringBoot的在线文档管理系统的设计与实现
  • R 基础运算
  • 基于卷积神经网络(CNN)和ResNet50的水果与蔬菜图像分类系统
  • 机器视觉检测相机基础知识 | 颜色 | 光源 | 镜头 | 分辨率 / 精度 / 公差
  • Leetcode 串联所有单词的子串
  • 【windows】sonarqube起不来的问题解决
  • 人脸修复与增强腾讯开源项目GFPGAN介绍
  • python rabbitmq实现简单/持久/广播/组播/topic/rpc消息异步发送可配置Django
  • Java爬虫实战:深度解析Lazada商品详情
  • 解决ubuntu22.04常见问题