当前位置: 首页 > article >正文

2024 行远自迩,笃行不怠

2024年是充满变化与挑战的一年,我的开发方向经历了从智能驾驶工业智能检测,再到机器人感知交互与决策的不断演进。

这一年,我不断拓宽技术视野,深入探索不同领域的技术挑战和应用场景。

最初,我希望专注于单一领域深耕,但随着行业趋势的快速变化,我逐渐意识到跨领域知识融合持续学习的重要性。

面对这些转变,我学会了保持开放的心态,主动拥抱新技术,也在挑战中不断成长。

一、工业检测:从探索到落地

在工业智能检测领域,我深刻体会到工业场景对算法的高精度、高可靠性和高适应性的严格要求。

工业环境的复杂性远超预期,算法需要具备强的泛化能力,以适应不同的生产环境和产品型号的变化,这对算法的稳定性和鲁棒性提出了更高的挑战。

通过不断的优化和迭代,我在工程落地过程中积累了丰富的实践经验,逐步掌握了如何在工业应用场景中平衡算法性能与业务需求

学习了最新的YOLO11,从常规目标检测旋转目标检测实例分割等多个任务。

此外,我还学习研究了多种工业异常检测方法,例如:

  • RealNet(CVPR 2024):基于合成异常数据的工业异常检测方法,进一步拓展了检测的泛化能力。
  • DiAD(AAAI 2024):基于扩散模型,针对多类别工业异常检测的最新研究成果。
  • 3D工业视觉技术:学习了激光线扫、结构光等技术,探索其在工业检测中的应用潜力。

二、机器人技术探索:从6D位姿估计到具身智能

机器人技术的发展让我深感兴趣,从最初接触6D位姿估计,到深入研究抓取点估计,再到尝试物体重建,一步步加深了对机器人技术的理解。

随着对领域的深入了解,我发现,当前技术已逐渐实现端到端的6D位姿估计、抓取预测及物体重建,这些技术的发展让我对未来充满期待。

在研究过程中,我接触到了多个前沿技术和研究成果,例如:

  • SceneGrasp:支持多目标3D物体重建、6DoF位姿估计和抓取预测的综合框架。
  • Graspness:端到端的抓取点估计算法,提供更精准的抓取策略。
  • SAM-6D(CVPR 2024):结合实例分割,提升6D位姿估计的准确性。
  • FoundationPose(CVPR 2024):统一支持6D位姿估计与跟踪,增强系统的稳定性和泛化能力。
  • ZebraPose:采用层次化分组策略,实现从粗到细的表面编码,提升位姿估计的精度。
  • GDR-Net:基于单目输入的几何引导直接回归模型,简化了6D位姿估计的流程。

在机器人具身智能方面,我正在学习如何通过多模态融合技术,使机器人具备更强的动态交互和环境感知能力。

通过强化学习、模仿学习以及ISAAC Lab的仿真平台,我逐步探索机器人在复杂环境下的智能决策和自主操作能力。

三、智能驾驶:从感知到决策

在智能驾驶方向,我重点学习了多模态融合与视图变换技术,以提升感知精度和系统鲁棒性。其中,以下技术让我印象深刻:

  • BEV视图变换

    • Fast-Ray:基于查找表(LUT)的多视角到单个三维体素转换,极大提升了计算效率。
  • 多模态融合

    • MetaBEV:解决传感器故障问题,实现高精度3D检测与BEV分割。
    • SuperFusion(ICRA 2024):多层次融合激光雷达与相机数据,提供远距离高清地图预测。
    • CRN(ICCV 2023):结合多视角相机与雷达,实现3D目标检测、跟踪及BEV分割。
  • 4D毫米波雷达

    • CRN(ICCV2023):使用雷达与多视角相机融合,实现3D目标检测、3D目标跟踪、道路环境BEV分割。
    • ADCNet(2023):利用原始雷达数据,实现高效的目标检测和环境感知。
    • FFT-RadNet(CVPR 2022):用于目标检测与可行驶区域分割。
  • 占用网络

    • VoxFormer(CVPR 2023):基于视觉的3D语义场景理解方案。
    • SurroundOcc(ICCV 2023):环视相机实现3D语义占用预测,提供更全面的环境建模能力。

四、学习方式的进化:AI辅助让一切更高效

面对快速变化的行业环境,我意识到持续学习的重要性。

以往,阅读论文是获取新知识的主要途径,而现在,借助AI工具,学习效率得到了极大的提升。(GPT4o、Kimi、通义千问、元宝等)

AI不仅帮助我快速提取论文的核心要点,还能辅助进行技术归纳与方案对比,让我更高效地吸收新技术,并将其应用到实际项目中。

五、持续学习

在专注技术学习的同时,我也希望提升自己的管理能力,于是报名了清华大学经管学院的创新能力提升

这些课程涵盖了清华MBA数字化战略、公司治理20讲、商学导论、财务分析等,让我对管理有了更系统的认识。

通过学习,我逐渐意识到,技术与管理相辅相成,掌握管理思维有助于更好地推动项目落地,也能在未来的职业发展中走得更稳、更远。

六、2024年度文章推荐

1)YOLO11目标检测主题,下面是编写的博客,欢迎大家查看和学习:

一篇文章快速认识YOLO11 | 关键改进点 | 安装使用 | 模型训练和推理_yolov11改进-CSDN博客

YOLO11模型推理 | 目标检测与跟踪 | 实例分割 | 关键点估计 | OBB旋转目标检测_yolov11推理-CSDN博客

YOLO11模型训练 | 目标检测与跟踪 | 实例分割 | 关键点姿态估计_yolo11训练-CSDN博客

YOLO11 目标检测 | 导出ONNX模型 | ONNX模型推理_yolo11 onnx-CSDN博客

一篇文章快速认识 YOLO11 | 目标检测 | 模型训练 | 自定义数据集_yolo11n.yaml-CSDN博客

YOLO11 目标检测 | 自动标注 | 预标注 | 标签格式转换 | 手动校正标签_目标检测自动标注-CSDN博客 

2)YOLO11-旋转目标检测主题,下面是编写的博客,欢迎大家查看和学习:

YOLO11 旋转目标检测 | OBB定向检测 | ONNX模型推理 | 旋转NMS_yolov11 obb-CSDN博客

YOLO11 旋转目标检测 | 数据标注 | 自定义数据集 | 模型训练 | 模型推理-CSDN博客

一篇文章快速认识YOLO11 | 旋转目标检测 | 原理分析 | 模型训练 | 模型推理_旋转框目标检测-CSDN博客

3)YOLO11-实例分割主题,下面是编写的博客,欢迎大家查看和学习:

一篇文章快速认识 YOLO11 | 实例分割 | 模型训练 | 自定义数据集_yolo11分割-CSDN博客

YOLO11 实例分割 | 导出ONNX模型 | ONNX模型推理_yolov11分割-CSDN博客

YOLO11 实例分割 | 自动标注 | 预标注 | 标签格式转换 | 手动校正标签_yolov11实例分割-CSDN博客

4)机器人系列主题,下面是编写的博客,欢迎大家查看和学习:

【机器人】SceneGrasp 同时支持3D物体重建、6D位姿估计、抓取点估计-CSDN博客

【机器人】复现SceneGrasp 同时支持多目标 3D物体重建、6DoF位姿估计、抓取预测-CSDN博客

【机器人】ATM 用于策略学习的任意点轨迹建模 RSS 2024 | 论文精读-CSDN博客

【机器人】Graspness 端到端抓取点估计 | 环境搭建 | 模型推理测试-CSDN博客

【机器人】01 强化学习、模仿学习和运动规划 仿真平台ISAAC Lab安装与使用_isaaclab-CSDN博客

【6D位姿估计】FoundationPose 支持6D位姿估计和跟踪 CVPR 2024-CSDN博客

 【6D位姿估计】FoundationPose 跑通demo 训练记录_foundationpose demo-CSDN博客

5)智能驾驶主题,下面是编写的博客,欢迎大家查看和学习:

【多模态融合】MetaBEV 解决传感器故障 3D检测、BEV分割任务-CSDN博客

【多模态融合】SuperFusion 激光雷达与相机多层次融合 远距离高清地图预测 ICRA 2024-CSDN博客

【多模态融合】CRN 多视角相机与Radar融合 实现3D检测、目标跟踪、BEV分割 ICCV2023_多相机 雷达 拼接-CSDN博客

 4D毫米波雷达——原理、对比、优势、行业现状-CSDN博客

6)高效工具主题,下面是编写的博客,欢迎大家查看和学习:

标注工具 X-AnyLabeling | AI 推理引擎 | 自动标注 | 支持多种视觉任务_x anylabeling ai-CSDN博客

Python 应用程序 | 打包为| .exe可执行文件-CSDN博客

PCL从理解到应用【02】PCL环境安装 | PCL测试| Linux系统_pcl安装-CSDN博客

回顾这一年,从最初的不适应,到逐渐找到节奏并适应不同的技术领域,我在变化中成长,在挑战中进步。

2024年让我更加明确,保持学习、勇于探索才是持续成长的关键。

分享完成~


http://www.kler.cn/a/516467.html

相关文章:

  • 双目立体校正和Q矩阵
  • 除了基本的事件绑定,鸿蒙的ArkUI
  • SpringBoot使用MockMVC通过http请求controller控制器调用测试
  • 安卓动态设置Unity图形API
  • Next.js:构建大模型智能体GPT研究者应用的 Web开发框架
  • 图谱之前端关系应用
  • Geek Uninstaller,绿色免安装轻量的应用卸载工具!
  • 微软预测 AI 2025,AI Agents 重塑工作形式
  • 细节增强卷积DEConv详解及代码复现
  • 基于java的客户信息管理系统
  • Kafka面试题----Kafka中的Producer、Broker、Consumer以及Topic的概念
  • Python 快速下载依赖
  • 激光三角测量法精度计算
  • 为AI聊天工具添加一个知识系统 之65 详细设计 之6 变形机器人及伺服跟随
  • 单片机-STM32 IIC通信(OLED屏幕)(十一)
  • python-leetcode-随机链表的复制
  • 编写0号中断的处理程序
  • 【博客之星】年度总结:在云影与墨香中探寻成长的足迹
  • 牛客周赛 Round 77 A-C
  • 设计新的 Kibana 仪表板布局以支持可折叠部分等
  • Redis面试题每日20道【其二】
  • C语言二级
  • DeepSeek-R1:性能对标 OpenAI,开源助力 AI 生态发展
  • Android AutoMotive --CarService
  • SpringBoot如何自定义Starter ?
  • 【BUUCTF】[HITCON 2017]SSRFme1