当前位置：首页 > article >正文

【AI-28】RAG的深入浅出

article 2025/2/12 18:52:24

一句话理解 RAG

RAG 是一种让 AI 模型“先查资料再回答问题”的技术。它结合了搜索引擎（检索信息）和生成模型（生成答案）的优势，让回答更准确、更可靠。

为什么需要 RAG？

传统的生成模型（比如 ChatGPT）直接根据训练时学到的知识生成答案，但存在两个问题：

知识过时：模型无法实时获取最新信息（比如今天发生的新闻）。
可能胡编乱造：如果问题超出模型的知识范围，它可能会生成错误答案（俗称“幻觉”）。

RAG 的解决思路：
先让 AI 从外部数据库或文档中检索相关的信息，再基于这些信息生成答案。相当于先查资料，再写作文！

RAG 的工作流程

检索（Retrieval）
用户提问后，RAG 会先从海量文档、数据库或互联网中搜索与问题相关的信息。
例如：你问“如何治疗感冒？”，RAG 会检索医学指南、权威文章等。
增强（Augmentation）
将检索到的信息与用户的问题一起输入生成模型（如 GPT）。
相当于告诉模型：“根据以下资料，回答用户的问题。”
生成（Generation）
生成模型结合检索到的信息和自身知识，生成最终答案。
例如：“根据《2023年医学指南》，建议感冒患者多休息、补充水分，必要时服用退烧药……”

RAG 的优点

答案更准确：基于真实资料生成，减少“瞎编”的可能性。
支持最新信息：可以实时更新检索的数据库（比如接入互联网）。
灵活可控：通过调整检索的数据源，控制答案的专业性或风格。

RAG 的应用场景

智能客服：先查产品文档，再回答用户问题。
教育问答：结合教科书内容，生成知识点解析。
医疗咨询：检索医学文献，提供更可靠的建议。

举个例子🌰

用户问题：“特斯拉2023年的销量是多少？”

传统模型：可能根据训练数据（截止到2021年）回答错误答案。

RAG 模型：

检索最新财报或新闻，找到“2023年特斯拉全球交付180万辆”。

生成答案：“根据特斯拉2023年财报，全年交付量为180万辆。”

总结

RAG = 搜索引擎 + 生成模型，让 AI 的回答既像专家一样专业，又像图书管理员一样严谨。

http://www.kler.cn/a/542431.html

相关文章：

centos7 升级openssl并安装python3

【hive】记一次hiveserver内存溢出排查，线程池未正确关闭导致

【报错解决】Sql server 2022连接数据库时显示证书链是由不受信任的颁发机构颁发的

Spring统一修改RequestBody

四次挥手详解

Qt之设置QToolBar上的按钮样式

OpenCV2D 特征框架 (19)目标检测类cv::CascadeClassifier的使用

基于Win XDMA的PCIE 2.0 X8速率不足原因分析与解决方案

深度学习中的梯度相关问题

Python----PyQt开发（PyQt基础，环境搭建，Pycharm中PyQttools工具配置，第一个PyQt程序）

记录docker 卡住不动了

AIOS: 一个大模型驱动的Multi-Agent操作系统设计与Code分析

Ansible中playbook的变量

DeepSeek与蓝耘智算平台：人工智能与高效算力的协同革命

使用verilog 实现cordic 算法 ---- 向量模式

FAST_LIVO2初次安装编译

STM32 HAL库 SPI通讯（C语言）

阿里云百炼初探DeepSeek模型调用

【Pytorch实战教程】深入了解 PyTorch 中的 SummaryWriter

ES 索引结构

32单片机学习记录0之前导

ubuntu部署postgresql+timescaladb时序数据库

深度学习｜表示学习｜Instance Normalization 全面总结｜26

互联网大厂面试高频题-操作系统部分

Node.js开发属于自己的npm包（发布到npm官网）

deepseek+kimi一键生成PPT