RAG技术:是将知识库的文档和问题共同输入到LLM中
RAG技术
RAG技术是将知识库的文档和问题共同输入到LLM中
RAG技术是先从知识库中检索出与问题相关的文档片段,然后将这些检索到的文档片段与问题一起输入到LLM中进行回答。具体过程如下:
文本分块
由于LLM的上下文窗口有限,需要将长文本资料分割成较小的块,以便LLM能够有效地处理。
嵌入及存储块到向量数据库
使用向量嵌入技术为每个文本块生成向量表示,并存储这些向量到向量数据库中。
检索
当用户提出查询时,系统利用向量数据库进行检索,找到与查询语义上最相似的文本块。
生成回答
将检索到的文本块与用户的问题一起作为LLM的输入,LLM根据接收到的上下文信息和问题生成回答。
RAG技术即检索增强生成技术,是一种将检索系统与生成模型相结合的技术架构,利用向量数据库从外部知识库中检索相关信息,增强大模型生成的能力。以下是一些具体应用的例子: