当前位置: 首页 > article >正文

Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks

摘要

大型预训练语言模型已经被证明可以在其参数中存储事实性知识,并在下游自然语言处理(NLP)任务中通过微调取得了最先进的效果。然而,它们访问和精准操控知识的能力仍然有限,因此在知识密集型任务上,它们的表现往往落后于专门为任务设计的架构。此外,这些模型在决策时提供知识来源以及更新其世界知识仍是待解决的研究问题。通过引入与非参数化显式记忆相连的可微访问机制,预训练模型有望克服此问题,但迄今为止这仅在提取型下游任务中得到了研究。

介绍

我们探索了一种面向通用的微调方法,称为检索增强生成(RAG),这种方法将预训练的参数化记忆和非参数化记忆相结合用于语言生成。我们引入了 RAG 模型,其中参数化记忆为预训练的序列到序列(seq2seq)模型,非参数化记忆为维基百科的稠密向量索引,通过预训练的神经检索器来访问。我们比较了两种 RAG 形式,一种是在整个生成序列中使用相同的检索段落,另一种则允许在每个生成的 token 时使用不同的段落。

我们在一系列知识密集型 NLP 任务上对模型进行了微调和评估,在三个开放领域问答任务上达到了最先进的效果,优于仅参数化的 seq2seq 模型和专门为任务设计的检索和提取架构。在语言生成任务中,我们发现 RAG 模型生成的语言比最


http://www.kler.cn/a/390508.html

相关文章:

  • Android Framework AMS(16)进程管理
  • 如何用WordPress和Shopify提升SEO表现?
  • 【Java SE】接口类型
  • 想租用显卡训练自己的网络?AutoDL保姆级使用教程(PyCharm版)
  • 计算机毕业设计必看必学35755flask旅游景区热度可视化平台原创定制程序,java、PHP、python、小程序、文案全套、毕设成品等
  • Python数据预处理
  • c语言数据结构与算法--简单实现队列的入队和出队
  • 如何提高自动驾驶中惯性和卫星组合导航pbox的精度?
  • 钉钉扫码登录(DTFrameLogin) 用户注销后重新登录出现回调叠加的问题
  • 动态规划 之 简单多状态 dp 问题 算法专题
  • Vue — 组件化开发
  • ZYX地图瓦片转mbtiles文件(Python)
  • Postman上传图片如何处理
  • Docker-软件容器平台
  • springboot基于java无人超市管理系统,计算机毕业设计项目源码314,计算机毕设程序(LW+开题报告、中期报告、任务书等全套方案)
  • 漫谈MCU优化:从硬件设计优化到可靠性挑战
  • NVM切换本地node版本
  • Vue前端开发:gsap动画库
  • 10.桥接模式设计思想
  • 基础网络安全知识
  • 修改msyql用户密码及更新mysql密码策略
  • Redis - Hash 哈希
  • MR30分布式IO热插拔:智能时代的便捷与高效
  • uni-app小程序echarts中tooltip被遮盖
  • ★ 算法OJ题 ★ 前缀和算法(下)
  • [OS] 区分按位与()和逻辑与()