当前位置: 首页 > article >正文

指定PDF或图片多个识别区域,识别区域文字,并导出到Excel文件中

常见场景

用户有大量图片/PDF文件,期望能将图片/PDF中的多个区域中的文字批量识别出来,并导入到Excel文件中。期望工具可以批量处理、离线识别(保证数据安全性)。手工操作麻烦。具体场景:用户有工程现场照片,订单,简历等PDF或图片文件,期望按照PDF或图片中关键的文字导出到Excel中,后期对文件进行快速检索 ,不用每个文件打开看。
在这里插入图片描述

相关技术

QT库、离线OCR识别算法、Python的Excel库。
基本处理思路:
1、批量加载PDF或图片文件
2、指定对应的识别范围
3、根据识别范围裁剪对应图片
4、裁剪后的图片批零OCR识别
5、将识别结果导出到Excel文件中

工具处理

第一步:下载软件

PDF或图片基于文字内容批量改名工具
百度网盘:https://pan.baidu.com/s/104inoJ7RsmbF-P07E882cA?pwd=qpch
腾讯微盘:https://share.weiyun.com/pq0GbDGI

第二步:打开软件

下载软件后,解压缩文件夹到本地,双击JDX图片识别.exe,启动主程序。

第三步:选择要改名的PDF或图片文件

选择待改名的图片或者PDF,可以按照文件夹选择,也可以按部分文件选择。
可分别导入图片文件、或者PDF文件(支持按指定范围页导入)。
在这里插入图片描述

第四步:设置要识别区域(可设置多个)

在识别范围窗体里,添加需要识别的范围(按住鼠标拉框绘制识别区域),通过同步范围设置把当前图片的识别区域同步到其他图片上。
在这里插入图片描述

第五步:对自定义范围进行批量识别文字

执行批量识别文字,识别结果淡绿色,右侧识别结果文字,可以校核与编辑。离线识别。
在这里插入图片描述

第六步:导出结果-导出Excel

选择导出的路径以及导出方式,可以导出Excel,也可以导出Word。导出内容包含:图片名称、指定的多个识别区域(名字),识别文字。
在这里插入图片描述

至此,通过以上步骤就能对PDF或图片按照多个识别区域文字,批量导出Excel。
• 本地离线识别、安全稳定(拔掉网线也能识别运行)
• 批量提取图片文字:提取指定区域文字,导出Excel
• 批量提取PDF文字:提取指定区域文字,导出Excel
• PDF文件支持:可复制版的PDF、扫描版的PDF都支持


http://www.kler.cn/a/325643.html

相关文章:

  • 2024年11月19日随笔
  • 商业iOS端路由架构演进
  • Vue3中使用Axios构建高效的请求处理机制
  • 不完全微分PID控制算法
  • SpringBoot:不支持发行版本17超详细解决办法
  • Linux Kernel Programming 2
  • 25届秋招总结——保持自信、坚定选择
  • 【C++算法】6.双指针_有效三角形的个数
  • Android 10.0 系统framework层修改第三方app的dpi的属性功能实现
  • mmseqs2蛋白质聚类数据格式转化
  • C++进阶知识1继承
  • 从零预训练一个tiny-llama#Datawhale组队学习Task2
  • [题解] Codeforces Round 976 (Div. 2) A ~ E
  • OpenCV-图像拼接
  • C++游戏开发:构建高性能、沉浸式游戏体验的关键
  • 无人机之集群路径规划篇
  • 「系列投研|01」建立自己的移动比特币银行——赛道概况
  • Python办公自动化案例:实现XMind文件转换成Excel文件
  • AIGC: 从两个维度快速选择大模型开发技术路线
  • el-table初始化时根据传入数据选中某些行
  • HTML中的盒子模型(内置练习及答案)
  • 医院排班|医护人员排班系统|基于springboot医护人员排班系统设计与实现(源码+数据库+文档)
  • git 查看已经commit但是还没有push的所有文件变动内容
  • upsample nearest 临近上采样实现方式
  • Python: RAII:函数执行完毕,socket对象主动发送fin
  • golang Get: context deadline exceeded (Client.Timeout exceeded while aw