当前位置：首页 > article >正文

Event driven agentic document workflows 笔记 - 3

article 2025/3/22 20:29:04

RAG代理与工作流

课程概述

本课程介绍了如何使用 RAG（检索增强生成）技术构建代理，以处理简历文档并回答相关问题。通过解析简历、将数据存储为向量索引，并使用 LLM（大语言模型）进行查询，最终实现一个可以处理复杂任务的代理系统。

主要步骤

1. 启用异步操作

首先，启用嵌套异步以确保笔记本正常运行，并引入必要的导入库。

2. 配置 API 密钥

OpenAI API 密钥：用于文本嵌入和查询。
Llama Cloud API 密钥：用于解析 PDF 文件。

3. 使用 Llama Parse 解析简历

Llama Parse：高级文档解析器，用于提取简历内容并转换为易于理解的格式（如 Markdown）。
步骤：
1. 加载文档并指定解析类型（简历）。
2. 格式化内容为项目符号列出相关信息（如公司名、职责、技能）。

4. 向量存储与索引

使用 OpenAI 嵌入 API，将解析后的文本转化为向量格式。
- 使用 OpenAI 提供的 text-embedding-3-small 模型。
创建 向量存储索引，使其能够进行高效的相似度查询。

5. 创建查询引擎

使用 OpenAI LLM（如 GPT-4o-mini）结合向量存储索引创建查询引擎。
设置查询引擎返回与查询相关的最相似的前 K 个结果。

6. 持久化向量存储

将向量存储保存到磁盘，确保可以在后续使用时加载。
加载已有索引，避免重复解析。

7. 创建代理系统

使用 函数工具 和 函数调用代理，将查询简历的函数包装成代理。
设置代理的 LLM，并与查询引擎交互，进行问题回答。

8. 构建 RAG 工作流

创建一个 RAG 工作流类，将解析、存储、查询整合在一起。
工作流分为：
1. 解析简历并存储到磁盘。
2. 加载存储的索引或重新解析文档。
3. 触发查询事件，查询引擎返回结果。

9. 执行 RAG 工作流

运行工作流，提供简历文件位置和查询内容。
快速回答关于简历的问题，避免重复解析。

关键概念

RAG（检索增强生成）：将检索（从数据库中查找相关内容）与生成（使用 LLM 生成回答）结合起来，以提高回答的准确性和效率。
向量存储：将文档数据转化为向量形式，便于高效的相似度查询。
查询引擎：利用预先处理的向量索引，通过 LLM 回答问题。

查看全文

http://www.kler.cn/a/595816.html

【Javascrip】Javascript练习01 REST API using Express.js.

NFS 安装与测试

MySQL数据库入门到大蛇尚硅谷宋红康老师笔记高级篇 part11

C++修炼：内存管理

最质量实践Docker

Github 2025-03-21Java开源项目日报Top9

【Linux 维测专栏 2 -- Deadlock detection介绍】

解决 C 盘空间不足，免费软件高效清理

初级：控制流程面试题精讲

《实战指南：基于Linux环境部署与应用Milvus向量数据库》

(四)---四元数的基础知识-(定义)-(乘法)-(逆)-(退化到二维复平面)

C++学习之QT中HTTP正则表达式

从OSI七层网络模型角度了解CAN通信协议

Android HAL服务注册与获取服务

php 批量把数组中的日期时间转为时间戳

OpenGL ES -＞乒乓缓冲，计算只用两个帧缓冲对象(Frame Buffer Object)+叠加多个滤镜作用后的Bitmap

算法2--两数相加

系统思考—啤酒游戏经营决策沙盘模拟

selenium在实际的项目测试过程中的运用

Linux信号：一场内核与用户空间的暗战