当前位置: 首页 > article >正文

麻省理工学院的研究人员最近开发了一种新的机器人训练方法

  每周跟踪AI热点新闻动向和震撼发展 想要探索生成式人工智能的前沿进展吗?订阅我们的简报,深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同,从行业内部的深度分析和实用指南中受益。不要错过这个机会,成为AI领域的领跑者。点击订阅,与未来同行! 订阅:https://rengongzhineng.io/

麻省理工学院的研究人员最近开发了一种新的机器人训练方法,既能节省时间和成本,又能提升机器人适应新任务和环境的能力。论文下载:https://arxiv.org/pdf/2409.20537

这种方法被称为异构预训练变换器(HPT),它将来自多个来源的大量多样化数据整合成一个统一的系统,相当于为生成式AI模型创建了一种共享语言。这种方法与传统的机器人训练大相径庭,后者通常需要工程师为每个机器人和任务在受控环境下收集特定数据。

MIT电气工程与计算机科学的研究生王力瑞(Lirui Wang)领导了这项研究。他指出,尽管很多人认为机器人训练数据不足是一个主要挑战,但更大的问题在于各种不同领域、模态和机器人硬件的多样性。团队的研究展示了如何有效地结合和利用这些多样化的元素。

研究团队开发了一种能够统一处理各种数据类型的架构,包括摄像头图像、语言指令和深度图。HPT采用了类似于高级语言模型的变换器模型来处理视觉和本体感受输入。

在实际测试中,该系统表现非凡——在模拟和现实场景中,其表现比传统训练方法提高了20%以上。即使在机器人面临与训练数据大相径庭的任务时,这种提升依然显著。

研究团队为预训练准备了一个令人印象深刻的数据集,包含了52个数据集,超过20万个机器人轨迹,涵盖了四个类别。这种方法让机器人能够从丰富的经验中学习,包括人类演示和模拟。

系统的一大创新在于对本体感受(机器人对自身位置和运动的感知)的处理。团队设计的架构将本体感受与视觉信息同等重要,从而实现了更复杂的灵活动作。

展望未来,团队计划提升HPT处理未标注数据的能力,类似于先进的语言模型。他们的终极愿景是创建一个可以下载并适用于任何机器人的通用机器人“大脑”,无需额外训练。

尽管目前还处于早期阶段,团队对于规模化的前景充满信心,认为这可能会引领机器人策略领域的突破,类似于大型语言模型所带来的进展。


http://www.kler.cn/a/385785.html

相关文章:

  • WebRTC视频 04 - 视频采集类 VideoCaptureDS 中篇
  • 如何知道表之间的关系(为了知识图谱的构建)
  • 使用Java绘制图片边框,解决微信小程序map组件中marker与label层级关系问题,label增加外边框后显示不能置与marker上面
  • PyAEDT:Ansys Electronics Desktop API 简介
  • 网络基础(4)传输层
  • Python酷库之旅-第三方库Pandas(218)
  • 互联网技术净土?原生鸿蒙开启全新技术征程
  • Tomcat中如何指定JDK版本
  • node.js版本管理工具nvm
  • 【dvwa靶场:XSS系列】XSS (DOM) 低-中-高级别,通关啦
  • ARM64的Mac Node.js前置工作,nvm在线安装
  • JVM中对象在堆中的生命周期?
  • 《Java核心技术 卷I》第10章 图形用户界面程序设计
  • 「QT」几何数据类 之 QRect 矩形类
  • 2025年入门深度学习或人工智能,该学PyTorch还是TensorFlow?
  • 证明正交标架
  • SpringBoot使用自定义注解对API接口进行数据校验
  • golang 实现比特币内核:实现基于椭圆曲线的数字签名和验证
  • 伦敦金价格是交易所公布的吗?
  • 基于Multisim直流稳压电源电路(含仿真和报告)
  • linux查看网络配置
  • 任务中心全新升级,新增分享接口文档功能,MeterSphere开源持续测试工具v3.4版本发布
  • 微服务架构面试内容整理-Archaius
  • 编译器、IDE对C/C++新标准的支持
  • 微服务系列六:分布式事务与seata
  • 游戏提示错误:xinput1_3.dll缺失?四种修复错误的xinput1_3.dll文件