当前位置：首页 > article >正文

深度学习-131-RAG技术之基于Anything LLM搭建本地私人知识库的应用策略问题总结(二)

article 2025/2/26 7:14:57

文章目录

1 AnythingLLM是如何工作的
2 AnythingLLM中的几个关键参数和配置
- 2.1 分块处理
- 2.2 Embedding嵌入模型
- 2.3 TopK检索召回
- 2.4 LLM 大模型首选项
- 2.5 减少幻觉的设定技巧
3 告别幻觉和睁眼说瞎话
- 3.1 关键原则
- 3.2 关键机理剖析
- - 3.2.1 Pin固定的含义
  - 3.2.2 Chunk Size与向量数Vector Count
  - 3.2.3 TopK检索召回片段数
4 参考附录

1 AnythingLLM是如何工作的

在AnythingLLM中，我们不会读取您的整个文件系统，然后将其报告给LLM，因为它会浪费99%的时间。

相反，您的查询是根据您的文档文本矢量数据库处理的，我们会从被认为与您的提示 “相关” 的文档中取回4-6个文本块。

例如，假设你有一个包含数百个食谱的工作空间，不要问“给我3种高卡路里食物的标题”。这个LLM会断然拒绝这一点！但是为什么呢？

当你将检索增强生成(RAG)用于文档聊天机器人时，你的整个文档文本不可能适合大多数大语言模型(LLM)的上下文窗口。将文档分割成文本块，然后将这些文本块存储在向量数据库中，这样可以更容易地根据你的查询，用相关信息片段来 “增强” 大语言模型的基础知识。

在这里插入图片描述

让我们将AnythingLLM视为一个框架或管道。
(1)创建了一个工作区。
LLM只能看到嵌入在此工作区中的文档。如果未嵌入文档，LLM将无法查看或访问该文档的内容。
(2)您上传文档。
这使得 “移动到工作区” 或 “嵌入” 文档成为可能。上传会获取您的文档并将其转换为文

http://www.kler.cn/a/561416.html

相关文章：

HOMIE：具有同构外骨骼座舱的人形机器人操控

冯诺依曼体系结构 ──── linux第8课

vue-signature-pad插件实现移动端签字功能（css,js）+将签名照片旋转90度之后的base64码传给后端

npm i 失败权限问题

详解：用Python OpenCV库来处理图像并测量物体的长度

计算机考研之数据结构：斐波那契数列专题(1)

Linux设备驱动开发-SPI驱动开发详解（包含设备树处理详细过程）

第4章 Unicode 文本和字节序列

神经网络 - 神经元

【压力测试】要不要做全链路压测？

Jasper AI技术浅析（四）：自然语言处理（NLP）与生成技术

4部署kibana:5601

【Python】2.获取pypi的api token 并把自己写好的库上传到pypi（保姆级图文）

在 Windows 下的 Docker 中安装 R语言

Linux下安装Nginx服务及systemctl方式管理nginx详情

编写一个程序，输入一个字符串并输出其长度(Java版)

Redis｜持久化

栅格地图路径规划：基于雪橇犬优化算法（Sled Dog Optimizer，SDO）的移动机器人路径规划（提供MATLAB代码）

day02

推荐几款开源免费的 .NET MAUI 组件库