当前位置：首页 > article >正文

LangChain教程 - Agent -之 REACT_DOCSTORE

article 2025/3/17 11:01:38

1. 引言

在智能问答和知识检索的场景下，如何让 AI 既具备推理能力，又能高效利用外部知识库？ReAct 框架已经展现了强大的推理能力，而 ReACT_DOCSTORE 则进一步增强了这一能力，结合了文档存储（DocStore），让 AI 先检索文档，再进行推理，从而提供更加准确的信息。

本文将详细介绍 ReACT_DOCSTORE 的特点、优势、局限性，以及其典型应用场景，并通过代码示例展示如何使用它来构建一个强大的知识库问答系统。

2. 什么是 ReACT_DOCSTORE？

2.1 ReAct 框架回顾

ReAct（Reasoning + Acting）是一种结合了推理（Reasoning）和行动（Acting）的智能代理架构。它让 AI 能够在推理的同时与环境进行交互，从而提升决策能力。例如，在问答任务中，ReAct 允许 AI 先进行逻辑推理，再调用搜索工具获取更多信息。

2.2 ReACT_DOCSTORE 介绍

ReACT_DOCSTORE 在 ReAct 基础上集成了文档存储（DocStore），让 AI 先检索相关文档，再进行推理。这种方式适用于信息密集型任务，能够大幅提高 AI 对知识库的支持能力。

3. ReACT_DOCSTORE 的特点

3.1 主要特点

集成文档存储：支持与文档存储库（如 FAISS、ChromaDB）集成，能高效管理和检索文本信息。
先检索，后推理：在回答问题前，AI 先从存储的知识库中检索最相关的文档，再结合推理能力进行回答。
增强知识库问答能力：适用于 RAG（Retrieval-Augmented Generation）系统，可以帮助 AI 提供更准确、可信的答案。

3.2 主要优势

强化对外部知识库的支持：相比传统 ReAct，ReACT_DOCSTORE 让 AI 能够更有效地访问和利用知识库。
适用于信息密集型任务：如企业知识管理、技术文档查询、法律法规搜索等。
可与向量数据库集成：支持 FAISS、Weaviate、Pinecone 等主流向量数据库，提高检索效率。

3.3 主要局限性

需要预先准备文档库：在使用前需要先构建好文档数据库，初始化成本较高。
依赖文档质量：如果知识库中的文档质量较低，可能会影响最终的回答质量。
计算资源消耗较大：向量搜索和 LLM 推理都会消耗一定的计算资源，可能导致响应时间较长。

4. 典型应用场景

企业内部知识库问答：如公司政策、产品手册查询，帮助员工快速获取所需信息。
法律法规智能检索：用户可以输入法律问题，系统从法规数据库中检索相关条款并进行解读。
科研文献分析：用户输入研究主题，AI 从论文数据库中检索相关文献，并生成总结。
技术支持系统：结合公司文档库，为客户提供精准的技术支持。

5. 代码示例：构建 ReACT_DOCSTORE 代理

以下代码示例展示了如何使用 FAISS 作为向量数据库，加载文档并创建一个 ReACT_DOCSTORE 代理。

from langchain.vectorstores import FAISS
from langchain_ollama.embeddings import OllamaEmbeddings
from langchain.document_loaders import PyPDFLoader
from langchain.tools import Tool
from langchain.agents import AgentType, initialize_agent
from langchain.chat_models import ChatOllama

# 加载文档并创建向量存储
loader = PyPDFLoader("knowledge.txt")
docs = loader.load()
vectorstore = FAISS.from_documents(docs, OllamaEmbeddings(model="nomic-embed-text"))


# 定义检索工具
def retrieve_docs(query: str):
    return vectorstore.similarity_search(query, k=3)


docstore_tool = Tool(name="Document Retriever", func=retrieve_docs, description="检索文档内容")

# 初始化代理
agent = initialize_agent(
    tools=[docstore_tool],
    llm=ChatOllama(model="llama3:8b"),
    agent=AgentType.REACT_DOCSTORE,
    verbose=True
)

# 运行查询
response = agent.run("查找人工智能相关资料")
print(response)