当前位置：首页 > article >正文

如何让大模型不再“已读乱回”——RAG技术助力生成更精确的答案

article 2025/4/2 17:46:04

随着大语言模型（LLM） 的迅猛发展，越来越多的领域开始受益于其强大的自然语言处理能力。从写作到编程，LLM已成为我们日常生活和工作的得力助手。然而，这些看似无所不能的大模型，却有一个致命的弱点：它们是基于海量的公共数据训练的，对于私人领域或者某些垂直领域的回答效果并不理想，有时甚至会出现“幻觉”，也就是“已读乱回”，一本正经地胡说八道，还无法获取最新的数据。

那么，如何让这些大模型不再“胡言乱语”呢？答案就是——RAG技术（检索增强生成技术）。

在这里插入图片描述

什么是RAG技术？

RAG（Retrieval-Augmented Generation）是一种通过结合外部数据库的检索能力来增强语言模型生成能力的技术。简单来说，RAG技术就像是给模型加了一本“参考书”，每当你提问时，模型会先去“查阅资料”，然后根据查找到的相关信息生成更准确、事实性的答案。

比如，如果你问大模型：“哪个大模型最好用？”模型不会凭空猜测答案，而是会从知识库中检索出相关信息，结合当前问题生成更贴合实际的回答。这就像是给模型开卷考试——不再盲目答题，而是查证答案，确保准确性。

RAG核心流程

1.文档资料准备

文档资料是模型参考的资料，资料的质量越高，模型推理得到的回答质量也越高。文档资料可以是pdf文件、网页等各种形式，关键是要确保资料的真实性和相关性。

2.数据分块

由于模型的输入量有限制，并且将文档分块也有利于后续的检索，因此需要对文档进行合理的分块。常见的分块方法有：

按照语意分块：根据文档的语义内容进行分块，可以更好地保持语义的连贯性。
固定长度且有重叠：这种方法快速又简单，重叠连续的块有助于保持跨块的语义上下文。
基于语法的块：将文档分解成句子，spaCy 或 NLTK 等自然语言处理库可以提供帮助。
基于文件格式的分块：某些文件类型具有内置的自然分块，最好保持这他们。例如，代码文件最好作为整个函数或类进行分块和矢量化；HTML 文件应保留 <table> 或 base64 编码的 <img> 元素不变；对于 pdf 文件也应采取类似的考虑。Unstructured 或 Langchain 等库可以协助使用此方法。

3.数据向量化

计算机虽然可以用字符表示文本，但这样无法计算文本的相似度，因此需要将文本数字化，也就是向量化（embedding），用一组向量来表示一句话。然后可以通过余弦距离或者欧几里得距离来衡量句子的相似度。

4.构建向量数据库

将所有文本分块、向量化后，就可以构建向量数据库了。向量数据库能够高效地存储和检索向量数据，为后续的检索提供基础。

RAG的如何工作

在这里插入图片描述

当你向LLM提问时，RAG的工作流程大致如下：

用户提问：你向模型提出问题。
检索相关信息：模型通过向量数据库寻找相关的文本块。
返回相似度最高的结果：数据库返回与问题最相关的几个信息片段。
优化prompt：将用户的提问和检索到的信息结合起来，生成一个高质量的提示词（prompt）。
得到满意的回答：模型根据优化后的prompt生成回答，从而得到一个满意的回答。

RAG的优势

1. 灵活性高
传统的LLM需要通过重新训练来更新模型知识，这既昂贵又耗时。而RAG技术只需要替换掉知识库中的文档，就能即时调整模型的知识，使其更适应新的领域或信息。例如，如果你想问：“谁是冰岛总理？”模型可以通过更新数据源来保证回答准确，不需要重新训练整个模型。

2. 经济高效
重新训练LLM需要巨大的计算资源和财力，而RAG只需要替换文档数据库，成本大幅降低。通过RAG，生成式人工智能可以更广泛、更高效地应用到各种领域。

3.实时信息更新
即使LLM的原始数据集已经很完善，但随着时间推移，信息可能过时。RAG技术可以将模型与实时的新闻、社交媒体等信息源连接，确保模型能提供最新的答案。

4. 增强用户信任
由于RAG能引用信息源，生成的答案更有据可依。如果用户想深入了解答案背后的来源，可以直接查阅相关文档。这不仅增加了信息的可信度，也增强了用户对生成式人工智能的信任。

5. 更大的开发控制权
RAG技术赋予开发人员更高的控制权。开发人员可以根据需要调整和优化模型的知识库，甚至对某些敏感问题的答案进行特别处理，确保模型的输出更符合需求。

RAG技术的应用场景

借助检索增强生成，用户实际上可以与数据存储库进行对话，从而开启新的体验。这意味着 RAG 的应用范围可能是可用数据集数量的数倍。例如：

医疗领域：生成式人工智能模型加上医疗指数，可以成为医生或护士的得力助手，帮助他们快速获取最新的医疗信息和研究成果。
金融领域：金融分析师将受益于与市场数据挂钩的助手，能够实时获取最新的市场动态和分析数据。
企业内部：企业可以将技术或政策手册、视频或日志转化为可增强 LLM 的资源（称为知识库），实现客户或现场支持、员工培训和开发人员生产力等用例。

总结

RAG技术为大模型解决了许多传统LLM的“痛点”，特别是在精确性和时效性方面。通过让模型不断“查资料”，我们能有效避免大模型“已读乱回”的问题，提供更为精准、可靠的回答。对于未来的人工智能应用而言，RAG无疑是一个重要的技术发展方向。

感谢您的阅读，如果你觉得本文对您有帮助，可以点赞支持一下作者❤️❤️❤️。您的每一份认可，都是持续分享优质科技内容的动力源泉，让我们携手共进，紧跟科技脚步。

http://www.kler.cn/a/468813.html

相关文章：

NLP期末复习

书生大模型入门第二节

推荐系统重排：DPP 多样性算法

科大讯飞android面试题及参考答案

Appium（二）--- ADB命令操作

实时高保真人脸编辑方法PersonaMagic，可根据肖像无缝生成新角色、风格或场景图像。

【数据库系列】Spring Boot 中整合 MyBatis-Plus详细步骤

学习Video.js

第四十三天|动态规划|子序列| 300.最长递增子序列，674. 最长连续递增序列，718. 最长重复子数组

DeepSeek-V3 正式发布，已在网页端和 API 全面上线，性能领先，速度飞跃。

【第二部分--Python之基础】05 类与对象

详细讲一下Canvas标签的基础使用和应用场景

集成方案：基于慧集通的某客户多系统间集成简略方案（致远OA、NCC高级版、三方物业系统、发票税务系统等）

模拟出一个三维表面生成表面点，计算体积，并处理边界点

系统架构师考试-CBSE基于构件的软件工程

前端开发语言涉及到的注解（Annotations）

vue3 vite 使用代理转发

阿赵的MaxScript学习笔记分享十六《MaxScript和WinForm交互》

【Python系列】Python 中的 `enumerate` 函数及其应用

基于区块链的共享算力系统概念方案