当前位置: 首页 > article >正文

VikParuchuri/marker 学习简单总结

核心代码

VikParuchuri/marker 的核心是使用https://github.com/VikParuchuri/surya的 pdf 模型,注意不仅仅是ocr,在marker的代码里面有标注ocr 是option的。强制OCR 要设置:OCR_ALL_PAGES=true

核心代码就是convert.py

def convert_single_pdf(
        fname: str,
        model_lst: List,
        max_pages: int = None,
        start_page: int 

http://www.kler.cn/news/333462.html

相关文章:

  • 2款.NET开源且免费的Git可视化管理工具
  • Django一分钟:在Django中怎么存储树形结构的数据,DRF校验递归嵌套模型的替代方案
  • Python 工具库每日推荐 【BeautifulSoup】
  • wordpress函数has_tag()函数与get_the_tags()有什么区别?
  • 使用PL/SQL Deverloper过程遇见的问题
  • RTSP协议讲解
  • 简单线性回归分析-基于R语言
  • 算法笔记(十)——队列+宽搜
  • 基于muduo库函数实现protobuf协议的通信
  • LabVIEW提高开发效率技巧----调度器设计模式
  • 堆排序算法的原理与应用
  • 【第三版 系统集成项目管理工程师】第15章 组织保障
  • Command | Ubuntu 个别实用命令记录(新建用户、查看网速等)
  • spring揭秘24-springmvc02-5个重要组件
  • 计算机毕业设计 助农产品采购平台的设计与实现 Java实战项目 附源码+文档+视频讲解
  • 【vs code(cursor) ssh连不上服务器(2)】但是 Terminal 可以连上,问题解决 ✅
  • 常用排序算法(下)
  • 增删改查sql
  • Kafka 消费者状态及高水位(High Watermark)详解
  • MySQL数据库用户权限控制的实现方法