当前位置: 首页 > article >正文

Meta新模型Dualformer:融合快慢思维,推理能力媲美人脑

Meta 的 FAIR 团队最近推出了一款名为 Dualformer 的全新 Transformer 模型,该模型模仿人类的双重认知系统,能够无缝整合快速和慢速推理模式,在推理能力和计算效率上取得了显著突破。

人类的思维过程通常被认为是由两种系统控制的:系统1快速直观,系统2则更慢但更具逻辑性。

传统的 Transformer 模型通常只模拟了系统1或系统2中的一种,导致模型要么速度快但推理能力差,要么推理能力强但速度慢且计算成本高。

image.png

Dualformer 的创新之处在于其训练方式。研究人员利用随机推理轨迹对模型进行训练,在训练过程中随机丢弃轨迹的不同部分,类似于分析人类思维过程并创建捷径。这种训练策略使 Dualformer 能够在推理时灵活切换不同的模式:

快速模式: Dualformer 只输出最终解决方案,速度极快。

慢速模式: Dualformer 会输出完整的推理链和最终解决方案,推理能力更强。

自动模式: Dualformer 可以根据任务的复杂程度自动选择合适的模式。

image.png

实验结果表明,Dualformer 在迷宫导航和数学问题求解等任务上表现出色。在慢速模式下,Dualformer 能够以97.6% 的成功率解决30x30的迷宫导航任务,超越了只使用完整推理轨迹训练的 Searchformer 模型,同时推理步骤减少了45.5%。

image.png

image.png

在快速模式下,Dualformer 的成功率也高达80%,远高于只使用最终解决方案训练的 Solution-Only 模型。在自动模式下,Dualformer 则能够在保持高成功率的同时,显著减少推理步骤。

image.png

image.png

Dualformer 的成功表明,将人类认知理论应用于人工智能模型设计能够有效提升模型的性能。这种融合快慢思维的模式为构建更强大、更高效的 AI 系统提供了新的思路。

参考文章:Meta新模型Dualformer:融合快慢思维,推理能力媲美人脑 | 进击的胖虎


http://www.kler.cn/a/353649.html

相关文章:

  • 【数据库】一、数据库系统概述
  • 鼠标自动移动防止锁屏的办公神器 —— 定时执行专家
  • 【 Verdi实用技巧-Part-3】
  • 抢占欧洲电商高地,TikTok 运营专线成 “秘密武器”
  • 计算机网络例题
  • YARN WebUI 服务
  • Mamba学习笔记(2)—序列数据处理基础
  • 顺序表删除相关的算法题|删除最小值|删除值为x的值|删除区间内的值|删除重复的元素(C)
  • Vue3 路由基础 02
  • 爬虫案例——网易新闻数据的爬取
  • 【数据结构】宜宾大学-计院-实验三
  • 【Linux 从基础到进阶】防止数据泄露的策略与工具
  • 前端开发攻略---取消已经发出但是还未响应的网络请求
  • 文心智能体 | AI大师工坊 | 【超省钱小助手】智能体开发经验分享
  • Vidmore Screen Recorde 2.0.20 学习 体验 不错!
  • 【VUE】Vue2中 v-model 的原理
  • 使用 Bash 脚本实现交互式用户输入(参数选择)
  • vue3基础入门以及常用api使用
  • 视频智能分析平台LiteAIServer摄像机视频分析软件下载水土识别算法方案
  • 爬虫post收尾以及cookie加代理
  • BWA-mem Smith-Waterman 算法
  • 【VUE】Vue2中如何监听(检测)对象或者数组某个属性的变化
  • 第七课:Python学习之算数运算符
  • 强化学习之DQN算法
  • yocto编辑软件包-devtool的使用方法
  • 微服务中的负载均衡算法与策略深度解析