当前位置: 首页 > article >正文

RAT:融合RAG和CoT的高效多步推理任务策略

今天分享的是由北京大学、加州大学洛杉矶分校和北京通用人工智能研究院合作发表的一篇文章

论文题目:RAT: Retrieval Augmented Thoughts Elicit
Context-Aware Reasoning in Long-Horizon
Generation

论文链接:https://arxiv.org/pdf/2403.05313

代码地址:https://github.com/CraftJarvis/RAT

Demo地址:https://huggingface.co/spaces/jeasinema/RAT

论文概述

思维链技术通过在提示词中加入“让我们一步一步思考”的指令,模型会自动输出中间推理步骤,从而生成更加精准的答案。这种方法不仅提高了答案模型的推理能力,还增强了答案的可解释性。但是由于大模型的幻觉问题,在长任务推理中模型可能会生成看似合理但实际上并不准确的推理信息。因此这篇论文考虑在COT的基础上加上了RAG,即RAT,通过利用检索到的外部信息为大模型提供推理依据。RAT的核心包含两个关键思想:

  • 利用 LLMs 的 zero-shot 能力生成初始思维链,并将思维链和原始任务放入提示中检索有助于修正错误思维链的信息;
  • 采用渐进的方法,当前思维步骤会根据任务提示、过去的思维链信息以及检索到的文档进行修正。

论文核心

RAT 的核心是将 RAG 用于修正由 CoT 提示生成的每一个思维步骤中,通过查找不同参考文档来不断修正每一个思维步骤,确保推理的每一步都有准确且可靠的信息支持。

  1. 生成初始的思维:对于给定的任务,首先根据提示“让我们逐步思考”,让 LLM 生成逐步的思维过程, 得到
    T : = { T i } i = 1 n T := \left\{ T_i \right\}_{i=1}^{n} T:={ Ti}i=1n ,其中 T i T_i T

http://www.kler.cn/a/417534.html

相关文章:

  • B站自研的第二代视频连麦系统(上)
  • 实名制-网络平台集成身份证实名认证接口/身份证查询-PHP
  • ElasticSearch入门
  • ASP.NET Core 中使用依赖注入 (DI) 容器获取并执行自定义服务
  • 动静态库的学习
  • matlab小波交叉功率谱分析源代码
  • 【ROS2】ROS2 Hello World (C++实现)
  • Keras构建卷积神经网络
  • 48-基于单片机的LCD12864时间调控和串口抱站
  • Oracle对比表与表之间的结构
  • 【Lucene】单个cpu 每秒能支持多少个bm25公式的计算
  • Apache Flink从Kafka中消费商品数据,并进行商品分类的数量统计题
  • 【测试工具JMeter篇】JMeter性能测试入门级教程(四):JMeter中BeanShell内置方法使用
  • 拓扑排序(C++实现)
  • ffmpeg安装(windows)
  • updatexml报错注入原理分析
  • kylinos-server源码安装xrdp
  • 丹摩征文活动 | SD3+ComfyUI的图像部署实践 AIGC图像
  • 基于Java Springboot蛋糕订购小程序
  • 【大模型实战篇】基于大模型GLM的检索增强实践
  • dpcas - v1 (Deep Learning Componentized Application System):深度学习组件化应用系统
  • VBA代码解决方案第二十讲:EXCEL工作表的添加与删除
  • PID模糊控制算法(附MATLAB仿真程序)
  • 【Java】设计模式——策略模式
  • PVE中的VLAN问题
  • 多线程(3)线程中的常用结构