当前位置：首页 > article >正文

Retrieval-Augmented Generation，检索增强生成流程

article 2025/2/8 22:12:49

RAG流程

用户输入接收
- 系统接收用户输入的查询问题或文本内容，例如“李白有哪些著名的作品？”用户输入可以通过自然语言处理（NLP）模型的输入端口或用户交互界面（如聊天应用、搜索引擎输入框等）接收。
查询向量库
- 将用户输入转换成向量，并在向量库中进行相似性搜索。向量库中存储了大量文本的向量表示，这些文本可以是书籍、文章、知识库条目等。例如，向量库中有某个文档表示李白的著名作品，其向量与用户输入的向量相似度很高，系统就会返回这个文档。
调用大模型处理结果
- 将向量库返回的相关文档信息与用户原始查询一起输入到大语言模型中。大模型会将检索结果与用户问题结合，生成连贯的回答。例如，对于用户查询“李白有哪些著名的作品？”大模型会融合检索到的李白作品的文档内容，生成类似“李白的著名作品有《将进酒》《静夜思》等”的回答。
输出应答给用户
- 大模型生成的回答通过输出端口返回给用户。在聊天应用的界面中，用户会在屏幕上看到答案，例如李白著名作品的列表。

RAG的优势

结合检索系统和生成模型：能利用最新信息，提高答案质量，具有更好的可解释性和适应性。
无需重新训练模型：通过检索外部知识库，无需对大语言模型进行重新训练，即可提供准确、相关且实用的输出。

RAG的挑战

检索质量问题：检索结果的准确性会直接影响最终生成的回答质量。
额外计算资源需求：检索和生成过程需要额外的计算资源支持。

RAG的进一步发展

高级RAG：在数据索引、检索前和检索后都进行了额外处理，通过更精细的数据清洗、设计文档结构和添加元数据等方法提升文本的一致性、准确性和检索效率。
模块化RAG：结构更加自由灵活，引入了更多具体功能模块，例如查询搜索引擎、融合多个回答等，并将检索与微调、强化学习等技术融合。

http://www.kler.cn/a/537002.html

相关文章：

设计模式 -＞模板方法模式（Template Method Pattern）

赛博算命之 ”梅花易数“ 的 “JAVA“ 实现 ——从玄学到科学的探索

什么是Spring

记一次golang环境的变化

工业物联网平台-视频识别视频报警新功能正式上线

Python设计模式 - 原型模式

HTML01-知云接力

【C语言】C语言经典面试题详解

传华为2025年新品更新用上超声波指纹nova上红枫

大模型做导师之方案版本比较

Unity Shader Graph 2D - 使用DeepSeek协助绘制一个爱心

Spring Boot启动内嵌tocmat原理

mysql的原理及经验

Vue3+codemirror6实现公式（规则）编辑器

记录一次mysql主从

【远程控制】安装虚拟显示器

快速上手——.net封装使用DeekSeek-V3 模型

openCV函数使用(一)

JMeter通过BeanShell写入CSV文件中的中文乱码

MoviePy，利用Python自动剪辑tiktok视频

【Unity 墓地和自然环境场景资产包】PBR Graveyard and Nature Set 2.0 高质量的墓地3D 模型，丰富的自然环境元素，轻松构建具有沉浸感和氛围感的游戏世界

三级等保、二级等保谁更高级 ?等保都有哪些?

Gateway路由匹配规则详解

k8s网络插件及基础命令

LINUX——内核驱动程序

Python+requests实现接口自动化测试