当前位置: 首页 > article >正文

2024年度总结(具身智能赛道,欢迎交流)

      随着各个互联网大厂,新能源产业纷纷入场机器人赛道,各家几近明牌,都笃定未来十年具身智能将是最重要的科技革命之一。想起一句话“技术爆发的节点,就是入场的时机”。机器人是否能真正替代人类暂且不论,只谈谈个人的一些经历。

1 一些探索

      跟随时代的大潮,2024年对各类机器人硬件、算法、仿真软件,落地部署等有了一定了解,也做了一些测试,当然多数是基于开源的资料做的仿真测试案例,一部分是基于开源做的适配。

  • 包括机械臂,无人机,移动小车,移动机械臂,旋翼机械臂,四足+机械臂,6D抓取姿态预测,基于相机和VR的遥操作,主从臂遥操作等,基于大模型的机械臂任务生成,VLA模型微调。
  • 算法涉及强化学习,模仿学习,深度学习,大模型,传统控制,基本通讯逻辑,
  • 测试软件包括gazebo,mujoco,webots,Isaac gym,Isaac sim。
  • 此外做了斗地主ai和掼蛋ai测试,基于文心和GPT的问答网站搭建。

      总体上看,各方面都有所涉及,但并未深入,然而也算有一些经验,包括市场上各家各类机器人产品的优势,各类前沿方案的可复现情况,和改进逻辑。

2 一些看法

      从硬件上看各家的硬件尚未收敛,或者说尚未有一个最优的硬件方案,当前的市场甚至未真正进入一个百家争鸣的态势,随着研发和竞争的的进一步加剧,成本会进一步降低,直到这个价格适合进入千家万户,各行各业,这个时候会才会真正呈现一个机器人革命,而现在仍是机器人时代来临的前夕,也是入场的好时机。

      从算法上看,当前机器人领域同样希望做一个大模型,但在实际推理时需要较高的算力,如果远程部署会影响实时性,如果本地部署存在成本高,部署硬件大的问题。GPU小型化、高性能仍是需要解决的问题,在保证性能的前提下,减小模型也是一个重中之重。

      但这两者解决之后最大的问题还是场景部署,尽管各家都在提倡通用场景,但目前看短期难以实现,当前的问题仍是机器人如何快速真正适应一个复杂多变的场景。

3 一些想法

      具身智能这个赛道还很长,也很大,需要做的东西很多。我对这个方向很感兴趣,也正在参与其中,接下来主要是做端到端。欢迎感兴趣的朋友一块探索这片蓝海。


http://www.kler.cn/a/519610.html

相关文章:

  • LongLoRA:高效扩展大语言模型上下文长度的微调方法
  • 工业数据分析:解锁工厂数字化的潜力
  • 微信小程序-点餐(美食屋)02开发实践
  • 讯飞绘镜(ai生成视频)技术浅析(二):大模型
  • 政安晨的AI大模型训练实践三:熟悉一下LF训练模型的WebUI
  • 青少年编程与数学 02-007 PostgreSQL数据库应用 15课题、备份与还原
  • Mysql 默认隔离级别分布式锁乐观锁
  • JAVAweb学习日记(八) 请数据库模型MySQL
  • ray.rllib-入门实践-11: 自定义模型/网络
  • 第22章 走进xUnit:测试驱动开发的关键工具(持续探索)
  • 凝“华”聚智,“清”创未来-----华清远见教育科技集团成都中心2024年度总结大会暨2025新春盛典
  • 【论文阅读】HumanPlus: Humanoid Shadowing and Imitation from Humans
  • 蓝桥杯之c++入门(一)【第一个c++程序】
  • 27. 【.NET 8 实战--孢子记账--从单体到微服务】--简易报表--报表服务
  • Docker 系列之 docker-compose 容器编排详解
  • 【信息系统项目管理师-选择真题】2017上半年综合知识答案和详解
  • Transfoemr的解码器(Decoder)与分词技术
  • QT:控件属性及常用控件(4)-----多元素控件、容器类控件、布局管理器
  • 3.numpy练习(2)
  • RabbitMQ 分布式高可用
  • 【Linux】Linux编译器-g++、gcc、动静态库
  • 7、知识库内容更新与自动化
  • 系统编程(线程互斥)
  • 牛角棋项目实践1:牛角棋的定义和用python实现简单功能
  • 大模型开发 | RAG在实际开发中可能遇到的坑
  • rewrite规则