当前位置：首页 > article >正文

【干货教程】DeepSeek R1+Open WebUI构建RAG检索增强知识库的实战教程

article 2025/2/21 7:26:27

文章目录

一、前文
二、什么是RAG？
三、示例和使用
- 3.1 新建知识库
- 3.2 添加模型
- 3.3 测试和使用
四、高级功能
- 4.1 嵌入模型选择
- 4.2 引用追踪
- 4.3 混合搜索增强
- 4.4 YouTube 内容集成
- 4.5 文档解析支持
五、总结
六、参考

一、前文

DeepSeek R1大模型相关文章如下：

Windows电脑本地部署运行DeepSeek R1大模型（基于Ollama和Chatbox）
【万字教程】在Windows计算机部署DeepSeek大模型，给在实验室无外网的同事们用（基于Ollama和OpenWebUI）
【史上最简单】DeepSeek R1+Open WebUI实现个人知识库和企业知识库的智能管理

清华大学出品了两份关于DeepSeek的使用文档，可以通过如下两个方式进行获取。

关注【小康师兄】微信公众号，回复【清华大学DeepSeek：从入门到精通】即可获取下载链接。
关注【小康师兄】微信公众号，回复【DeepSeek如何赋能职场应用】即可获取下载链接。

二、什么是RAG？

检索增强生成（RAG）将大语言模型与从外部源检索的知识相结合。

系统从上传的文档或知识库中检索相关数据，提高响应的质量和准确性。

三、示例和使用

3.1 新建知识库

工作空间——>知识库——>单击右上角的加号

在这里插入图片描述

上传文件

在这里插入图片描述

3.2 添加模型

工作空间——>知识库——>单击右上角的加号

RAG本身就是AI模型和知识库的结合，所以需要
- 选择AI模型
- 选择知识库
- 管理权限

在这里插入图片描述

保存并创建后，得到2个模型。
- deepseek-r1:14b：仅deepseek-r1:14bAI模型，不包含任何知识库。
- 客户资料智能体：包含deepseek-r1:14bAI模型和客户信息知识库。

在这里插入图片描述

3.3 测试和使用

使用deepseek-r1:14b模型，无法得到答案。

在这里插入图片描述

切换到客户资料智能体的模型，并新建对话。

在这里插入图片描述

使用客户资料智能体模型，得到正确答案。

四、高级功能

4.1 嵌入模型选择

支持 Ollama 和 OpenAI 的嵌入模型，可在管理面板>设置>文档中切换，以优化文档处理效果。

4.2 引用追踪

系统会自动为 LLM 使用的文档内容添加引用标记，确保信息来源可追溯，提高对话的可信度。

4.3 混合搜索增强

采用BM25算法进行基础搜索
使用CrossEncoder技术进行结果重排序
支持自定义相关性分数阈值
可根据需求切换混合搜索功能

4.4 YouTube 内容集成

支持直接处理 YouTube 视频 URL
自动提取和分析视频转录内容
将视频信息无缝整合到对话中

4.5 文档解析支持

系统配备多种解析器，可处理各类本地和远程文档。详细信息请参考get_loader函数文档。

五、总结

检索增强生成（Retrieval Augmented Generation，简称 RAG）是一项前沿技术，通过整合多源上下文信息来增强 AI 模型的对话能力。

它可以从本地文档、远程文件、网页内容，甚至 YouTube 视频等多媒体源中检索相关信息。

系统会将检索到的文本与预定义的 RAG 模板结合，添加到用户的提示词之前，从而提供更准确、更符合上下文的回答。

RAG 的核心优势在于其强大的信息整合能力，这使其成为处理复杂对话场景的理想解决方案。

例如，当用户询问特定文档或网页相关的问题时，RAG 可以智能地检索并整合相关信息到回答中。对于多媒体内容，如 YouTube 视频，RAG 可以分析视频字幕或说明文字，提取关键信息并融入对话中。

六、参考

教程：配置 Open WebUI 文档的 RAG 功能（https://openwebui-doc-zh.pages.dev/tutorials/tips/rag-tutorial/）
🔎 检索增强生成（RAG）| Open WebUI（https://openwebui-doc-zh.pages.dev/features/rag/）

若觉得文章对你有帮助，随手『点赞』、『收藏』、『关注』，也是对我的支持。

查看全文

http://www.kler.cn/a/551940.html