当前位置: 首页 > article >正文

PDF扫描版文字识别OCR

PDF扫描版文字识别OCR

最近需要有对PDF扫描版进行文字可识别的需求,这里介绍一款工具挺好用的

这是一款开源的OCR工具

github地址

https://github.com/hiroi-sora/Umi-OCR

在这里插入图片描述

主要功能及特点

  • 免费:本项目所有代码开源,完全免费。
  • 方便:解压即用,离线运行,无需网络。
  • 高效:自带高效率的离线OCR引擎,内置多种语言识别库。
  • 灵活:支持命令行、HTTP接口等外部调用方式。
  • 功能:截图OCR / 批量OCR / PDF识别 / 二维码 / 公式识别

下载地址

大家可以直接到github官网readme文档中有下载地址

我这里给出其对应官网的蓝奏云地址:
https://hiroi-sora.lanzoul.com/s/umi-ocr
(国内推荐,免注册/无限速)

大家下载时候可能系统会提示未知软件下载风险,这里大家正常安装就可以

开始使用

软件发布包下载为 .7z 压缩包或 .7z.exe 自解压包。自解压包可在没有安装压缩软件的电脑上,解压文件。

本软件无需安装。解压后,点击 Umi-OCR.exe 即可启动程序。


http://www.kler.cn/news/304958.html

相关文章:

  • docker+docker-compose+gitlab
  • CentOS 入门
  • 深度解析:云原生环境下Docker部署Doris数据库
  • XMOJ3376 结界
  • 深度神经网络
  • Django REST framework 实现缓存机制以优化性能
  • C/S架构和B/S架构哪个更好用一些?
  • Spire.PDF for .NET【文档操作】演示:创比较 PDF 文档
  • 【C++】——string(模拟实现)
  • 基于 ROS 的Terraform托管服务轻松部署Stable Diffusion
  • 逆向学习系列(三)adb的使用
  • 打造智能数据分析平台:基于 Flask 的数据处理与模型精度验证系统
  • 使用 Docker 进入容器并运行命令的详细指南
  • GANs-生成对抗网络
  • intellij idea创建java项目
  • MinGW探源:名称背后的故事、发音指南与历史沿革
  • (179)时序收敛--->(29)时序收敛二九
  • linux -L4.linux 暂停和启动进程
  • VUE工程中axios基本使用
  • SharePoint 创建本地 Web 部件 workbench 报错解决
  • quartus pin 分配(三)
  • Kubernetes (k8s)v1.27.1版本安装步骤
  • Jupyter Notebook | 安装 rise 插件后显示幻灯片失败
  • 【C#生态园】完整解读C#音频处理库:功能、安装配置和使用场景一网打尽
  • JavaScript 基础 - 第16天_AJAX入门
  • 什么是设计模式,要掌握那些知识
  • 若依笔记(六):前后端token鉴权体系
  • JUnit 5 详解
  • Redisson实现分布式锁
  • conda根据配置文件自动切换环境-----模仿 rvm 的 .ruby-version机制