当前位置: 首页 > article >正文

微软的 GraphRAG + AutoGen + Ollama + Chainlit = 本地和免费的多代理 RAG 超级机器人

在这里插入图片描述

集成和关键组件的图形摘要

R检索增强生成 (RAG) 是一种功能强大的工具,它使大型语言模型 (LLM) 能够访问现实世界的数据,从而做出更明智的响应。这是通过将模型与矢量数据库集成以进行实时学习和适应来实现的。此功能使 RAG 成为聊天机器人和虚拟助手等应用程序的首选,这些应用程序对实时准确且合理的响应需求很高。这种技术的高级变体称为图形检索增强生成 (GraphRAG),它将基于图形的知识检索的优势与 LLM 相结合,进一步增强了自然语言处理的能力。与依赖矢量相似性搜索的传统 RAG 方法不同,GraphRAG 从原始文本构建结构化知识图谱,捕获实体、关系和关键声明。这可以增强 LLM 理解和综合复杂数据集及其关系的能力,从而产生更准确且基于上下文的响应。

在这里插入图片描述

摘自麻省理工学院 Markus Beuhler 的一篇论文(链接在此处)

AutoGen 是 Microsoft 推出的一款工具,它通过自动化和优化曾经非常复杂且需要大量人工的工作流程,简化了基于多代理 LLM 的复杂应用程序的开发。将 AutoGen 想象成一个可以与多个 GPT 交互的平台,而不仅仅是一个。每个 GPT 都充当单独的“代理”,在综合操作中发挥着独特的作用。将 GraphRAG 的检索优势与 AutoGen AI 代理的对话和面向任务的功能相结合,可以打造出强大的 AI 助手,能够高效处理详细查询、生成和执行代码、创建多页科学报告以及进行数据分析。此外,离线本地 LLM(例如 Ollama 或 LM Studio 的 LLM)可确保经济高效且安全的数据处理。本地 LLM 消除了与在线 LLM 相关的高成本和隐私风险,将敏感数据保留在组织内部并降低运营费用。

本文将指导您使用 GraphRAG 检索系统构建多智能体 AI 应用程序,该系统完全在本地机器上运行,并且免费使用。以下是此应用程序的关键组件:

  1. GraphRAG 的知识搜索方法通过函数调用与 AutoGen 代理集成。
  2. GraphRAG(本地和全局搜索)配置为支持来自 Ollama 的本地模型进行推理和嵌入。
  3. AutoGen 已扩展,以支持通过 Lite-LLM 代理服务器从 Ollama 使用非 OpenAI LLM 进行函数调用。
  4. Chainlit UI 用于处理连续对话、多线程和用户输入设置。

G鉴于我的材料科学和计算建模背景,我想通过从 ABAQUS(一种 FEA 工程软件)的文档以及一些碳纤维和聚合物的技术数据表构建知识图谱来测试此应用程序。考虑到此数据集的复杂性,使用本地 LLM 的整体准确性可能会更好。未来的文章将探索使用不同模型进行嵌入和推理的基准研究的经验。尽管如此,我还是渴望从该领域的科学期刊和数据中构建更复杂的知识图谱,测试高级工程代码生成任务,并利用对话助手集思广益,探讨我专业范围内的科学主题。应用程序如下所示。

在这里插入图片描述

带有示例查询的主应用程序 UI。最后两个有相同的查询,但第一个是全局搜索,而第二个是本地搜索。

在这里插入图片描述

小部件设置在本地和全局搜索之间切换,设置社区级别和代长度。

开发是在 Linux 环境中使用 Windows Subsystem for Linux (WSL) 和 Visual Studio Code 在 Windows 11 PC 上完成的,该 PC 配备 i9 第 13 代处理器、64 GB RAM 和 24 GB Nvidia RTX 4090。为了在开发和测试此应用程序时获得最佳体验,建议使用 Linux 发行版或 WSL。我尚未在原生 Windows 环境中对此进行测试。有关安装 WSL 和设置 Python 和 Conda 环境的指南,请参阅本文(此处)。本文末尾提供了其他参考资料和相关信息。

这是源代码存储库的链接。现在,让我们开始吧!

安装模型依赖项并克隆存储库。

安装来自 Ollama 的语言模型以进行推理和嵌入

# Mistral 用于 GraphRAG 推理
ollama pull mistral 

# Nomic-Embed-Text 用于 GraphRAG 嵌入
ollama pull nomic-embed-text 

# LLama3 用于 Autogen 推理
ollama pull llama3 

# 在本地服务器上托管 Ollama:http://localhost:11434
 ollama serve

创建 conda 环境并安装这些依赖项

# 创建并激活 conda 环境
conda create -n RAG_agents python=3.12 
conda activate RAG_agents 

# Ollama 的 Lite-LLM 代理服务器
pip install 'litellm[proxy]' 

# 安装 Ollama
 pip install ollama 

# Microsoft AutoGen
 pip install pyautogen "pyautogen[retrievechat]"  

# Microsoft GraphRAG
 pip install graphrag 

# 文本令牌编码器-解码器
pip install tiktoken 

# Chainlit Python 应用程序
pip install chainlit 

# 克隆我的 Git-hub 存储库
git clone https://github.com/karthik-codex/autogen_graphRAG.git 

# (奖励)将 PDF 文件转换为 GraphRAG 的 Markdown
 pip install marker-pdf 

# (奖励)仅当您安装了 Marker-pdf 时,因为它默认会删除 GPU CUDA 支持
conda install pytorch torchvision torchaudio pytorch-cuda=12.1-c pytorch-c nvidia

您将在我的 GitHub 存储库中找到以下文件。

  1. /requirements.txt包含上述所有软件包的列表
  2. /utils/settings.yaml包含使用 Mistral 7B 和 Ollama 的 Nomic-Text-Embedding 进行 GraphRAG 离线嵌入和索引的 LLM 配置。 您将使用此文件替换首次在工作目录中初始化 GraphRAG 时创建的文件。
  3. /utils/chainlit_agents.py包含包括 AutoGen 助手和用户代理的类定义。这允许跟踪多个代理并将其消息显示在 UI 中。(感谢 Chainlit 团队构建模板*)**。*
  4. /utils/embedding.py包含使用 Ollama 进行本地搜索查询的 GraphRAG 嵌入修改后的嵌入函数。您将使用此文件替换 GraphRAG 包中的文件(更多信息见下文)
  5. utils/openai_embeddings_llm.py包含使用 Ollama 进行 GraphRAG 索引和嵌入的修改后的嵌入函数。您将使用此文件替换 GraphRAG 包中的文件(更多信息见下文)。
  6. /appUI.py包含设置代理、定义 GraphRAG 搜索功能、跟踪和处理消息以及在 Chainlit UI 中显示它们的主要异步函数。
  7. /utils/pdf_to_markdown.py奖励文件包含将 PDF 文件转换为 markdown 文件以供 GraphRAG 提取的功能。

创建 GraphRAG 知识库。

在存储库的根文件夹中初始化 GraphRAG

# 创建一个新文件夹“input”来放置 GraphRAG 的输入文件(.txt 或 .md)
mkdir -p ./input 

# 初始化 GraphRAG 以在根目录中创建所需的文件和文件夹
python -m graphrag.index --init --root 。

# 移动 settings.yaml 文件以替换由 GraphRAG 创建的文件 --init 
mv ./utils/settings.yaml ./

配置 GraphRAG 设置以支持来自 Ollama 的本地模型

下面是一段settings.yaml说明 LLM 创建索引和嵌入的配置的代码片段。GraphRAG 需要 32k 上下文长度才能进行索引,因此 Mistral 是所选模型。对于嵌入,选择了 Nomic-embed-text,但您可以尝试使用 Ollama 的其他嵌入。无需设置${GRAPHRAG_API_KEY},因为不需要访问这些本地模型的端点。

encoding_model: cl100k_base 
skip_workflows: [] 
llm:
  api_key: $ {GRAPHRAG_API_KEY}
  类型: openai_chat  # 或 azure_openai_chat
  模型: mistral 
  model_supports_json: true 
  api_base: http://localhost:11434/v1  
。。。嵌入:async_mode:threaded # 或 asyncio llm:api_key:${GRAPHRAG_API_KEY}类型:openai_embedding # 或 azure_openai_embedding模型:nomic_embed_text api_base:http://localhost:11434 / api 。。。输入:#将输入文件模式更改为.md 或 .txt类型:文件#或 blob文件类型:文本#或 csv base_dir:“输入”文件编码:utf-8文件模式:“。*\\.md$”



    
  
     
      
     
      



  
    
    
   
   
                                         

您可以在根目录中的“input”文件夹中指定包含输入文件的文件夹。文本和 markdown 文件都可以使用。您可以使用将/utils/pdf_to_markdown.pyPDF 转换为 markdown 文件,然后将其放在“input”文件夹中。处理多种文件格式的问题尚未解决,但这是一个可以解决的问题。

在运行 GraphRAG 进行索引、创建嵌入和执行本地查询之前,您必须修改 GraphRAG 包中的 Python 文件openai_embeddings_llm.py embedding.py。如果没有进行此修改,GraphRAG 在创建嵌入时会抛出错误,因为它不会将“nomic-embed-text”识别为来自 Ollama 的有效嵌入模型。在我的设置中,这些文件位于/home/karthik/miniconda3/envs/RAG_agents/lib/python3.12/site-packages/graphrag/llm/openai/openai_embeddings_llm.py/home/karthik/miniconda3/envs/RAG_agents/lib/python3.12/site-packages/graphrag/query/llm/oai/embedding.py

您可以使用命令来找到这些文件sudo find / -name openai_embeddings_llm.py

创建嵌入和知识图。

最后,我们创建嵌入并使用全局或本地搜索方法测试知识图谱。完成嵌入过程后,您可以在 GraphRAG 工作目录的“output”文件夹中找到输出工件(.parquet 文件)和报告(.json 和 .logs),在本例中,该文件夹是根文件夹。

# 创建知识图谱 - 这需要一些时间
python -m graphrag.index --root . 

# 测试 GraphRAG
 python -m graphrag.query --root . --method global "<插入您的查询>"

启动 Lite-LLM 服务器并从终端运行应用程序

下面是在运行应用程序之前初始化服务器的命令。我选择了 Llama3:8b 来测试这个应用程序。如果硬件允许,您可以使用更大的模型。有关 Lite-LLM 的更多信息,请访问此链接。现在,您可以从另一个终端运行该应用程序。确保您处于正确的 conda 环境中。

# 从终端启动服务器
litellm --model ollama_chat/llama3 

# 从另一个终端运行应用程序
chainlit run appUI.py

细分:appUI.py 的核心组件

导入 Python 库

导入autogen
从rich导入 打印
导入chainlit作为cl
从typing_extensions导入Annotated
从chainlit.input_widget导入(
   Select、Slider、Switch)
从autogen导入AssistantAgent、UserProxyAgent
从utils.chainlit_agents导入ChainlitUserProxyAgent、ChainlitAssistantAgent
从graphrag.query.cli导入run_global_search、run_local_search

您会注意到从chainlit_agents导入了两个类。这些 AutoGen 代理的包装器类使 Chainlit 能够跟踪其对话并处理终止或其他用户输入。您可以在此处相关信息。

配置 AutoGen 代理

AutoGen 代理通过 Lite-LLM 代理服务器利用来自 Ollama 的模型。这是必要的,因为 AutoGen 不支持通过非 OpenAI 推理模型进行函数调用。代理服务器允许使用 Ollama 模型进行函数调用和代码执行。

# 来自 Lite-LLM 服务器的 LLama3 LLM,用于代理 #
 llm_config_autogen = { 
    “seed” : 40 ,   # 更改不同试验的种子
    “temperature” : 0 , 
    “config_list” : [{ “model” : “litellm” , 
                     “base_url” : “http://0.0.0.0:4000/” , 
                     “api_key” : 'ollama' }, 
    ], 
    “timeout” : 60000 , 
}

在聊天开始时实例化代理并输入用户设置

我创建了三个 Chainlit 小部件(开关、选择和滑块)作为用户设置,以选择 GraphRAG 搜索类型、社区级别和内容生成类型。打开时,开关小部件使用 GraphRAG 本地搜索方法进行查询。内容生成的选择选项包括“优先列表”、“单个段落”、“多个段落”和“多页报告”。滑块小部件使用选项 0、1 和 2 选择社区生成级别。您可以在此处阅读有关 GraphRAG 社区的更多信息。

@cl.on_chat_start 
async  def  on_chat_start (): 
  try : 
    settings = await cl.ChatSettings( 
            [       
                Switch( id = "Search_type" , label= "(GraphRAG) 本地搜索" , initial= True ),        
                Select( 
                    id = "Gen_type" , 
                    label= "(GraphRAG) 内容类型" , 
                    values=[ "优先列表" , "单段落" , "多段落" , "多页报告" ], 
                    initial_index= 1 , 
                ),           
                Slider( 
                    id = "社区" , 
                    label= "(GraphRAG) 社区级别" , 
                    initial= 0 , 
                    min = 0 , 
                    max = 2 , 
                    step= 1 , 
                ), 

            ] 
        ).send() 

    response_type = settings[ "Gen_type" ] 
    community = settings[ "社区" ] 
    local_search = settings[ "Search_type" ] 
    
    cl.user_session.设置(“Gen_type”,response_type)
    cl.user_session.设置(“Community”,community)
    cl.user_session.设置(“Search_type”,local_search)

    retriever = AssistantAgent(
       name= “Retriever”,
       llm_config=llm_config_autogen,
       system_message= “”“仅执行函数query_graphRAG来查找上下文。
                    当提供答案时输出‘TERMINATE’。”“”,
       max_consecutive_auto_reply= 1,
       human_input_mode= “NEVER”,
       description= “Retriever Agent”
     )

    user_proxy = ChainlitUserProxyAgent(
        name= “User_Proxy”,
        human_input_mode= “始终”,
        llm_config=llm_config_autogen,
        is_termination_msg=lambda x:x.get(“content”,“”)。rstrip()。endswith(“TERMINATE”),
        code_execution_config = False,
        system_message = '''人类管理员。与检索器交互以提供任何上下文''',
        description = “用户代理代理”
     )
    
    print(“设置代理。”)

    cl.user_session。设置(“查询代理”,user_proxy)
    cl.user_session。设置(“检索器”,检索器)

    msg = cl.Message(content = f“”“您好!您今天想完成什么任务?       
                     “”“,
                     author = “User_Proxy”)
    await msg.send()

    print(“消息已发送。”)
    
  except Exception as e:
    print(“错误:”,e)
    通过

我选择不使用 Chainlit 包装器类作为检索器助手代理。这样我就可以禁用对检索器输出的跟踪,并直接捕获来自 GraphRAG 函数的响应。原因是当响应通过检索器时,文本会丢失其格式,包括空格和段落缩进。在生成带有主标题和副标题的多页报告时,此问题尤其明显。我可以通过绕过 Chainlit 包装器并直接从 GraphRAG 函数检索输出来保留原始格式。您将在下面看到我是如何实现这一点的。

更新输入设置中的更改

此功能可检测对设置中的选择、开关和滑块小部件所做的任何更改,以便在后续查询中反映这些更改。

@cl.on_settings_update 
async  def  setup_agent ( settings ): 
    response_type = settings[ "Gen_type" ] 
    community = settings[ "Community" ] 
    local_search = settings[ "Search_type" ] 
    cl.user_session.set ( " Gen_type" , response_type) 
    cl.user_session.set ( "Community" , community) cl.user_session.set     ( " Search_type" , local_search)打印( " on_settings_update" , settings)

使用来自代理和用户的传入消息更新 UI。

这是应用程序的核心部分,它创建了一个有两个代理的群聊,定义了一个函数“state_transition”来管理对话序列,并提供异步RAG查询功能。

您会注意到,INPUT_DIR ,ROOT_DIR, RESPONSE_TYPE, COMMUNTIY基于 bool 参数传递到本地和全局搜索 GraphRAG 查询函数中的参数LOCAL_SEARCHROOT_DIR,设置为’.’— 如果您在不同的目录中初始化了 GraphRAG,请注意这一点。

异步函数“query_graphRAG”调用 GraphRAG 全局或本地搜索方法。您会注意到函数await cl.Message(content=result.response).send()内部的一行async def query_graphRAG直接检索 RAG 查询的输出并保留检索到的内容的文本格式。

@cl.on_message 
async  def  run_conversation ( message:cl.Message ): 
    print ( "正在运行对话" ) 
    CONTEXT = message.content 

    MAX_ITER = 10
     INPUT_DIR = None
     ROOT_DIR = '.'
     RESPONSE_TYPE = cl.user_session.get( "Gen_type" ) 
    COMMUNITY = cl.user_session.get( "Community" ) 
    LOCAL_SEARCH = cl.user_session.get( "Search_type" ) 

    print ( "设置群聊" ) 

    trieser = cl.user_session.get( "Retriever" ) 
    user_proxy = cl.user_session.get( "查询代理" ) 

    def  state_transition ( last_speaker, groupchat ): 
        messages = groupchat.messages
        如果last_speaker是user_proxy: 
            return trieser
        如果last_speaker是withdrawer:
            如果messages[- 1 ][ "content" ].lower()不在 [ 'math_expert' , 'physics_expert' ]中: return user_proxy else :如果messages[- 1 ][ "content" ].lower() == 'math_expert' : return user_proxy else:返回user_proxy else:传递返回None async def query_graphRAG(          question:Annotated [ str,'包含您想要从 RAG 搜索中获取的信息的查询字符串' ])-> str:如果LOCAL_SEARCH:            result = run_local_search(INPUT_DIR,ROOT_DIR,COMMUNITY,RESPONSE_TYPE,question)else:            result = run_global_search(INPUT_DIR,ROOT_DIR,COMMUNITY,RESPONSE_TYPE,question)等待cl.Message(content = result)。send()返回[retriever]中的调用者的结果:         d_retrieve_content = caller.register_for_llm(            description = “检索代码生成和问答内容。”,api_style= "函数"         )(query_graphRAG)
                
            
                
                    
                
                    
        
            
             

      

                          
        

        

        
        

    




    对于[user_proxy, triest]中的代理:
        agents.register_for_execution()(d_retrieve_content) 

    groupchat = autogen.GroupChat( 
        agent=[user_proxy, triest], 
        messages=[], 
        max_round=MAX_ITER, 
        Speaker_selection_method=state_transition, 
        allow_repeat_speaker= True , 
    ) 
    manager = autogen.GroupChatManager(groupchat=groupchat, 
                                       llm_config=llm_config_autogen, 
                                       is_termination_msg= lambda x: x.get( "content" , "" ) and x.get( "content" , "" ).rstrip().endswith( "TERMINATE" ), 
                                       code_execution_config= False , 
                                       )     

# -------------------- 对话逻辑。根据您要完成的任务进行编辑以更改您的第一条消息。 ----------------------------------------- #
    如果 len (groupchat.messages) == 0:
      等待cl.make_async(user_proxy.initiate_chat)( manager,message=CONTEXT,)
    elif  len (groupchat.messages) < MAX_ITER:
      等待cl.make_async(user_proxy.send)( manager,message=CONTEXT,)
    elif  len (groupchat.messages) == MAX_ITER:  
      等待cl.make_async(user_proxy.send)( manager,message= “exit”,)

对于此应用程序,我们只需要两个代理。您可以添加/修改代理并配置“state_transition”函数来协调对话中的说话者选择,以实现更复杂的工作流程。

最后的想法

这是我第一次涉足 AI 代理、LLM 和 RAG,过去几周我直接开始创建此实现,绕过了许多基础知识。虽然此实现并不完美,但它是开发更复杂应用程序的绝佳模板。它为集成多个功能和编码代理奠定了坚实的基础,并使您能够构建复杂的工作流程、自定义代理交互并根据需要增强功能。

如何学习AI大模型?

作为一名热心肠的互联网老兵,我决定把宝贵的AI知识分享给大家。 至于能学习到多少就看你的学习毅力和能力了 。我已将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

一、全套AGI大模型学习路线

AI大模型时代的学习之旅:从基础到前沿,掌握人工智能的核心技能!

img

二、640套AI大模型报告合集

这套包含640份报告的合集,涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。

img

三、AI大模型经典PDF籍

随着人工智能技术的飞速发展,AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型,如GPT-3、BERT、XLNet等,以其强大的语言理解和生成能力,正在改变我们对人工智能的认识。 那以下这些PDF籍就是非常不错的学习资源。

img

四、AI大模型商业化落地方案

img

作为普通人,入局大模型时代需要持续学习和实践,不断提高自己的技能和认知水平,同时也需要有责任感和伦理意识,为人工智能的健康发展贡献力量。


http://www.kler.cn/a/445403.html

相关文章:

  • 基于Python3编写的Golang程序多平台交叉编译自动化脚本
  • 华为云计算HCIE笔记01
  • 【机器学习】机器学习的基本分类-强化学习(Reinforcement Learning, RL)
  • 【机器人】ATM 用于策略学习的任意点轨迹建模 RSS 2024 | 论文精读
  • 基于LSB最低有效位的音频水印嵌入提取算法FPGA实现,包含testbench和MATLAB对比
  • 方正畅享全媒体新闻采编系统 screen.do SQL注入漏洞复现
  • 14篇--模板匹配
  • C# 表达式树
  • C++ 11(1)
  • FPGA 基础了解
  • js日期时区问题
  • 初学stm32 --- PWM输出
  • 网络视频监控平台/安防监控/视频综合管理Liveweb视频汇聚平台解决方案
  • 鸿蒙项目云捐助第十一讲鸿蒙App应用的捐助成功自定义对话框组件实现
  • ubuntu 24.04-无域名创建本机和局域网和同网段局域网机器可访问的https网页服务
  • JAVA:组合模式(Composite Pattern)的技术指南
  • Nginx负载均衡(upstream)
  • SM2 算法介绍
  • UG NX二次开发(C#)-机电概念设计-UIStyler中selection块选择信号等对象的过滤器设置
  • Python语法之列表(包含检测练习)
  • 第十七章:反射+设计模式
  • facebook商业管理平台有什么作用?
  • 计算机网络 八股青春版
  • Spring Boot 2.1.7 数据源自动加载过程详解
  • 计算机图形学与虚拟现实(VR):相关学点、图形学、虚拟现实、未来发展
  • 细粒度生物医学多模态对比学习