wend看源码-(RAG工程)tiny-GraphRAG
RAG 工程
RAG 工程是一种将信息检索技术与大语言模型(LLM)相结合的工程实践方法,旨在增强大语言模型生成内容的准确性、可靠性和知识相关性。在传统的大语言模型中,其知识是在预训练阶段学到的,存在知识更新不及时、缺乏特定领域最新信息等问题。而 RAG 工程通过引入外部知识库,在生成文本时先从知识库中检索与用户查询相关的信息,再将这些信息与查询一起输入到语言模型中,以此来生成更有事实依据、更符合实际需求的文本。
GraphRAG
GraphRAG 则是 RAG 工程的一种扩展和改进形式,它在传统 RAG 的基础上引入了图数据结构。图由节点和边组成,节点可以表示各种实体(如人物、地点、事件等),边则表示实体之间的关系(如关联、从属、因果等)。GraphRAG 利用图的结构和语义信息,更高效地进行信息检索和知识推理,从而为大语言模型提供更丰富、更结构化的上下文信息,进一步提升生成内容的质量和准确性。
项目简介
Tiny-GraphRAG 是一个简洁版本的 GraphRAG 实现,旨在提供一个最简单的 GraphRAG 系统,包含所有必要的功能。我们实现了添加文档的全部流程,以及本地查询和全局查询的功能。
开源项目地址
https://github.com/limafang/tiny-graphrag
RAG-知识库项目构建基础架构
图1 RAG-知识库项目构建基础架构
-
由图1可知RAG整体技术路线可分为3个模块8个技术实现点。
-
3个模块分别为知识库构建模块,知识检索模块和智能问答模块。
-
知识库