当前位置: 首页 > article >正文

【智路】智路OS Perception Camera Service

Perception Camera Service

https://gitee.com/ZhiluCommunity/airos-edge/raw/r2.0/docs/02_Service/Perception_Camera_Service.md

单相机感知模块的主要任务是接收IP相机RTSP视频流,将其解码成RGB图片,并通过算法识别视频中的障碍物,最终将结果转换到世界坐标系。

智路OS提供了单相机感知组件的示例实现,该实现包括四个子模块:检测、跟踪、ROI过滤、回3D。

检测

通过深度学习算法实现物体识别,包括物体类别、2D框、长宽高、朝向角、底面中心点图像坐标等信息。输入图像首先经过yolov3的backbone进行特征提取,2D阶段输出目标的类别、置信度以及2D框,3D阶段输出目标的长宽高、朝向角以及物体底面中心点的2D坐标。

ROI过滤

感兴趣区域(ROI)是从图像中选择的一个图像区域,是图像分析的关注重点。ROI过滤模块的主要功能是过滤掉感兴趣区域外的物体。

跟踪

跟踪模块的主要任务是在给定图像序列中找到运动物体,并对不同帧的运动物体进行识别。每个物体都有一个确定准确的ID,可以是人、车辆、锥桶、三角牌等。跟踪算法对每一帧检测数据进行跟踪信息维护,采用度量方式(如kalman预测框、IOU、点迹势函数、deep learning方法等)进行目标关联。成功跟踪的目标输出给下游使用,而维护的目标则进入下一轮跟踪循环。

回3D

根据模型预测的图像坐标系下底面中心点的图像坐标(u,v),利用地面方程和相机内参,计算得到相机坐标系下底面中心点的3D坐标(X, Y, Z)。然后,利用模型预测的物体高度h,计算得到物体中心点在相机坐标系下的3D坐标。


http://www.kler.cn/news/305888.html

相关文章:

  • 【JAVA开源】基于Vue和SpringBoot的在线旅游网站
  • sheng的学习笔记-AI-FOIL(First-Order Inductive Learner)
  • conda、anaconda、pip、torch、pytorch、tensorflow到底是什么东西?(转载自本人的知乎回答)
  • php转职golang第一期
  • 深度学习-物体检测YOLO(You only look once)
  • 【SQL】百题计划:SQL对于空值的比较判断。
  • Linux学习笔记8 理解Ubuntu网络管理,做自己网络的主人
  • 一家电子元件企业终止,业绩规模小,疑似通过收购调节收入利润
  • 大数据-136 - ClickHouse 集群 表引擎详解1 - 日志、Log、Memory、Merge
  • windows 安全与网络管理问题
  • 【人工智能学习笔记】6_自然语言处理基础
  • 借老系统重构我准备写个迷你版apiFox
  • <Linux> 进程间通信
  • 医疗机构关于DIP/DRG信息化建设
  • 【linux】cat 命令
  • 什么是MIPI接口?MIPI相机是如何工作的?
  • 算法_优先级队列---持续更新
  • mysql组合键唯一
  • HTTP 四、HttpClient的使用
  • 一文带你全面了解RAID技术:从基础到进阶的全景解析
  • 大厂硬件梦:字节、腾讯“向首”,华为、小米“向手”
  • 设计模式之建造者模式(通俗易懂--代码辅助理解【Java版】)
  • MSYS vs MSYS2:功能、兼容性与易用性全面比拼,助你挑选最佳Windows开发伴侣
  • SpringBoot集成Thymeleaf模板引擎,为什么使用(详细介绍)
  • 【CSS in Depth 2 精译_031】5.3 Grid 网格布局的两种替代语法
  • TCP Analysis Flags 之 TCP ZeroWindow
  • 【机器学习】7 ——k近邻算法
  • npm install报错,gyp verb `which` failed Error: not found: python
  • 第十六节:学习Springboot 的自定义资源路径(自学Spring boot 3.x的第四天)
  • 鸿蒙之Hello Word 遇坑总结 mac系统 不能预览 提示 Only files in a module can be previewed 解决办法