当前位置: 首页 > article >正文

2M大小的PDF文档上传到LangChain-ChatGLM知识图谱中,大致需要的时间

对于将2M大小的PDF文档上传到LangChain-ChatGLM知识图谱中,大致需要的时间如下:

  • PDF到文本的提取转换:若PDF内容主要为文本,此步骤约需要1-2分钟。

  • 提取的文本经过预处理与分析:此步骤需要对文本进行分词、命名实体识别等处理,约需要2-5分钟。

  • 抽取文本中的结构化知识(实体、关系等)保存在图数据库中:对于2M文字,此步骤约需要5-10分钟。

  • 知识图与模型串联,使模型能利用新知识进行响应:这一步通常无需手动操作,模型在后台学习新知识,大约需要10-30分钟。

所以对一个普通2M PDF文档来说,整个上传并使LangChain-ChatGLM模型学习 吸收新知识的过程,大致需要10-30分钟。

需要注意的时:

  • 文本复杂程度影响预处理时间
  • 服务器性能会影响各个步骤的执行时间
  • 更大文档需要相对更长时间完成解析和学习
  • 模型学习新知识是异步进行的,只是大致时间

总体而言,对一个2M PDF来说,LangChain-ChatGLM可以在半小时内完成知识吸收,这与实际应用需求相匹配。更大文件相应需要更长时间。


http://www.kler.cn/a/108003.html

相关文章:

  • 2024 年 8 个最佳 API 设计工具图文介绍
  • Mit6.S081-实验环境搭建
  • Gurobi学术版+Anaconda安装步骤
  • vue3 pdf base64转成文件流打开
  • 【网络工程】计算机硬件概述
  • AI生活之我用AI处理Excel表格
  • 网络协议--TCP的成块数据流
  • C++单调向量算法应用:所有子数组中不平衡数字之和
  • 【ARM Coresight 系列文章19.2 -- Cortex-A720 AMU 详细介绍】
  • Babylonjs学习笔记(五)——创建PBR材质
  • Proteus仿真--闪烁的LED灯
  • 应用案例|基于三维机器视觉的曲轴自动化上下料应用方案
  • 配置两个网关之间通过IPSec VPN互联并通过总部IPSec网关进行NAT后上网
  • Django之登录注册
  • Redis快速上手篇七(集群-一台虚拟机六个节点)
  • 3.6 纹理压缩——包体瘦身术
  • 【经验总结】ECU系统休眠后通过诊断报文唤醒ECU且唤醒网络后快发NM报文
  • day36(http协议 服务器软件的使用 PHP的简单了解 前后端交互 ajax 同步和异步)
  • Hadoop 请求数据长度 Requested Data length 超过配置的最大值
  • Macos文件图像比较工具:Kaleidoscope for Mac
  • Tomcat最大并发数及在线用户数
  • 负载均衡--Haproxy
  • Vuex模块化(modules)与namespaced(命名空间)的搭配
  • Redis(05)| 数据结构-哈希表
  • 071:mapboxGL上传含shp的zip文件,在map上解析显示图形
  • 当前JavaEE初阶的阶段知识总结