当前位置: 首页 > article >正文

深度学习-131-RAG技术之基于Anything LLM搭建本地私人知识库的应用策略问题总结(二)

文章目录

  • 1 AnythingLLM是如何工作的
  • 2 AnythingLLM中的几个关键参数和配置
    • 2.1 分块处理
    • 2.2 Embedding嵌入模型
    • 2.3 TopK检索召回
    • 2.4 LLM 大模型首选项
    • 2.5 减少幻觉的设定技巧
  • 3 告别幻觉和睁眼说瞎话
    • 3.1 关键原则
    • 3.2 关键机理剖析
      • 3.2.1 Pin固定的含义
      • 3.2.2 Chunk Size与向量数Vector Count
      • 3.2.3 TopK检索召回片段数
  • 4 参考附录

1 AnythingLLM是如何工作的

在AnythingLLM中,我们不会读取您的整个文件系统,然后将其报告给LLM,因为它会浪费99%的时间。

相反,您的查询是根据您的文档文本矢量数据库处理的,我们会从被认为与您的提示 “相关” 的文档中取回4-6个文本块。

例如,假设你有一个包含数百个食谱的工作空间,不要问“给我3种高卡路里食物的标题”。这个LLM会断然拒绝这一点!但是为什么呢?

当你将检索增强生成(RAG)用于文档聊天机器人时,你的整个文档文本不可能适合大多数大语言模型(LLM)的上下文窗口。将文档分割成文本块,然后将这些文本块存储在向量数据库中,这样可以更容易地根据你的查询,用相关信息片段来 “增强” 大语言模型的基础知识。

在这里插入图片描述

让我们将AnythingLLM视为一个框架或管道。
(1)创建了一个工作区。
LLM只能看到嵌入在此工作区中的文档。如果未嵌入文档,LLM将无法查看或访问该文档的内容。
(2)您上传文档。
这使得 “移动到工作区” 或 “嵌入” 文档成为可能。上传会获取您的文档并将其转换为文


http://www.kler.cn/a/561416.html

相关文章:

  • HOMIE:具有同构外骨骼座舱的人形机器人操控
  • 冯诺依曼体系结构 ──── linux第8课
  • vue-signature-pad插件实现移动端签字功能(css,js)+将签名照片旋转90度之后的base64码传给后端
  • npm i 失败权限问题
  • 详解:用Python OpenCV库来处理图像并测量物体的长度
  • 计算机考研之数据结构:斐波那契数列专题(1)
  • Linux设备驱动开发-SPI驱动开发详解(包含设备树处理详细过程)
  • 第4章 Unicode 文本和字节序列
  • 神经网络 - 神经元
  • 【压力测试】要不要做全链路压测?
  • Jasper AI技术浅析(四):自然语言处理(NLP)与生成技术
  • 4部署kibana:5601
  • 【Python】2.获取pypi的api token 并把自己写好的库上传到pypi(保姆级图文)
  • 在 Windows 下的 Docker 中安装 R语言
  • Linux下安装Nginx服务及systemctl方式管理nginx详情
  • 编写一个程序,输入一个字符串并输出其长度(Java版)
  • Redis|持久化
  • 栅格地图路径规划:基于雪橇犬优化算法(Sled Dog Optimizer,SDO)的移动机器人路径规划(提供MATLAB代码)
  • day02
  • 推荐几款开源免费的 .NET MAUI 组件库