当前位置：首页 > article >正文

大模型 RAG 优化之预生成qa对

article 2025/2/7 9:06:21

1. 写在前面

检索增强生成 (Retrieval-Augmented Generation, RAG) 是一种将检索 (Retrieval) 和生成 (Generation) 相结合的技术，它利用检索到的相关信息来增强大型语言模型 (LLM) 的生成能力。传统的 RAG 系统通常直接使用用户输入的 query 在文档库中进行检索 (query-doc 检索)，然后将检索到的文档作为上下文提供给 LLM 进行生成。

然而，这种直接的 query-doc 检索方式可能存在一些问题：

用户 query 表达能力有限：用户输入的 query 可能不够准确或完整，无法有效地表达其信息需求。
query 和 doc 之间的语义鸿沟：用户 query 和文档之间可能存在语义鸿沟，即使是语义检索模型也难以完全弥合。

为了解决这些问题，我们可以采用一种新的检索策略：预生成候选 query 和 answer，将 query-doc 检索转换为 query-query 检索。

2. 预生成候选 query 和 answer 的方法

该方法的核心思想是：预先为文档库中的每个文档生成多个候选 query 和对应的 answer，然后将这些 query 和 an

http://www.kler.cn/a/534839.html

相关文章：

11 享元（Flyweight）模式

Qt展厅播放器/多媒体播放器/中控播放器/帧同步播放器/硬解播放器/监控播放器

【漫话机器学习系列】070.汉明损失（Hamming Loss）

3-Not_only_base/2018网鼎杯

pthread_cond_timedwait的概念和使用案例

深度学习中，文本分类任务怎么做

LLAMA-Factory安装教程（解决报错cannot allocate memory in static TLS block的问题）

第六期：开放银行突围战 - API经济下的跨域经营合规框架

如何在神经网络模型中通过低秩矩阵调整权重，并只训练少量参数

蓝桥杯C语言组：进制与整除问题

npm-npm ERR! missing script: serve

深入探索 C++ 类型转换的奥秘

Conmi的正确答案——Rider中添加icon作为exe的图标

使用java代码操作rabbitMQ收发消息

管理etcd的存储空间配额

汇编JCC条件跳转指令记忆

langchain教程-11.RAG管道/多轮对话RAG

DeepSeek让 Obsidian 更强大：Text generator与 Copilot 使用指南

【LeetCode: 1004. 最大连续1的个数 III + 滑动窗口】

？和.和*在正则表达式里面的区别

探索进制转换的奥秘/西瓜杯

fast-lio代码解析(二）

PE/西瓜杯

Linux 环境安装 Elasticsearch 8

每日一题——最小的K个数

【蓝桥杯嵌入式】4_key：单击+长按+双击