当前位置: 首页 > article >正文

如何基于Tesseract实现图片的文本识别

       在前一篇文章基础上,如何将报告图片中的文本解析出来,最近研究了基于Tesseract的OCR方案,Tesseract OCR是一个开源的OCR引擎,主要结合开源的tesseract和pytesseract,实现了jpg/png等格式图片文本识别,供大家参考,具体步骤和测试示例如下。

1.下载和安装tesseract和pytesseract

先安装pytesseract包,安装命令:pip3 install pytesseract
下载tesseract工具,地址:Home · UB-Mannheim/tesseract Wiki · GitHub
下载支持语言包(tessdata),地址:https://github.com/tesseract-ocr/tessdata,解压后拷贝到D:\tools\Tesseract-OCR目录下。

2.配置环境变量

配置环境到path变量:D:\xxx\Tesseract-OCR\tessdata和D:\xxx\Tesseract-OCR
增加环境变量TESSDATA_PREFIX=D:\xxx\Tesseract-OCR\tessdata
查看Tesseract的配置运行情况:tesseract -v 和 tesseract --list-langs

3.修改tesseract_cmd命令路径

修改pytesseract下的pytesseract.py文件,将tesseract路径设置为如下路径,具体如下:
tesseract_cmd = 'D:\xxx\Tesseract-OCR\tesseract.exe'

4.测试示例
# 利用tesseract实现图像的OCR,通过OCR提取图像中的文本信息,详见txt目录。  
localFiles=['d:\img\1.jpg']
image = Image.open(Path(localFiles[i]))
ocr_text = pytesseract.image_to_string(image) 
ocrfilename = localFiles[i].split('\\')[-1][:-4]
with open(os.path.join(output_folder, f'{ocrfilename}.txt'), 'w',  
          encoding='utf-8') as ocr_file:  
    ocr_file.write(ocr_text)  
print(str(i) + ".", ocrfilename, ' is completed by ocr')
5.OCR识别结果

原始图片

识别文字结果


http://www.kler.cn/a/396931.html

相关文章:

  • 一文3000字从0到1带你进行Mock测试(建议收藏)
  • HbuilderX 插件开发-模板创建
  • 如何在 Ubuntu 上配置 Kotlin 应用环境 ?
  • JavaSE常用API-日期(计算两个日期时间差-高考倒计时)
  • 黑盒测试案例设计方法的使用(1)
  • 微信小程序进行md5加密 ,base64 转码
  • Redis 持久化机制 RDB 和 AOF 区别
  • 图像重建之深度学习重建
  • 安全见闻5
  • 深入理解UML通信图:概念、构成与使用示例
  • macbook git 设置和远程克隆项目
  • 每日计划-1116
  • Linux下安装rabbitMQ
  • 知识图谱,语义分析,全文检索,neo4j,elaticsearch,知识库平台(java,vue)
  • 选择香港服务器的带宽和延迟配置时要注意的事项
  • 单向链表题库2(c++)
  • 【Android、IOS、Flutter、鸿蒙、ReactNative 】实现 MVP 架构
  • No Module named pytorchvideo.losses问题解决
  • c++设计模式之策略模式
  • 任务函数分析
  • 常用字符串和集合处理工具类
  • 微信小程序实战篇-分类页面制作
  • 【LINUX相关】
  • EHOME视频平台EasyCVR多品牌摄像机视频平台监控视频编码H.265与Smart 265的区别?
  • 硬件工程师面试题分析
  • DAY120java审计第三方组件依赖库挖掘FastjsonShiroLog4jH2DB