当前位置: 首页 > article >正文

深度学习-135-LangGraph之应用实例(四)构建RAG问答系统同时对文档进行元数据增强

文章目录

  • 1 文档处理
    • 1.1 网页内容加载
    • 1.2 文档智能分割
    • 1.3 元数据增强
      • 1.3.1 转换为Document
      • 1.3.2 增加元数据
  • 2 大语言模型
    • 2.1 一般输出
    • 2.2 结构化输出
  • 3 向量存储
  • 4 创建图
    • 4.1 可视化图
    • 4.2 调用图
  • 5 参考附录

使用langgraph构建一个智能文档检索系统。该系统能够从网页中提取信息,进行智能分段,并通过查询分析、向量检索实现精准的问答功能。

1 文档处理

1.1 网页内容加载

安装pip install beautifulsoup4。
WebBaseLoader是LangChain提供的一个强大的网页内容加载器,然后对获取到的内容进行处理,提取关心的信息。
在这里插入图片描述
(1)使用WebBaseLoader获取内容

from bs4 import BeautifulSoup
from langchain_community.document_loaders import WebBaseLoader
url = "https://gitee.com/anydev/awesome-python-cn/blob/master/README.m

http://www.kler.cn/a/564343.html

相关文章:

  • C++ 常见面试知识点
  • 【第九节】C++设计模式(结构型模式)-Composite(组合)模式
  • 细说 Java GC 垃圾收集器
  • TDengine 中的数据库
  • VSCode+PlatformIO报错 找不到头文件
  • 2024 年 6 月青少年软编等考 C 语言四级真题解析
  • Kafka消费者相关
  • HAL库 IIC写和读函数
  • 神经网络 - 激活函数(ReLU 函数 - 基本概念)
  • 2025年前端高频面试题(含答案)
  • MOBA:长上下文 LLMs 的混合块注意机制
  • RabbitMQ系列(一)架构解析
  • 第002文-kali虚拟机安全与网络配置
  • 3-2 WPS JS宏 工作簿的打开与保存(模板批量另存为工作)学习笔记
  • VSCode设置terminal路径默认为文件所在路径
  • Vue.js响应式基础
  • 【漫话机器学习系列】108.线性无关(Linearly Independent)
  • 斩波放大器
  • Rider 安装包 绿色版 Win/Mac/Linux 适合.NET和游戏开发者使用 2025全栈开发终极指南:从零配置到企业级实战
  • 解决“ReadTimeoutError:HTTPSConnectionPool”pip安装超时问题