当前位置: 首页 > article >正文

OCR图片中文字识别(Tess4j)

文章目录

      • Tess4J
      • 下载 tessdata
      • Java 使用Tess4j 的 demo

Tess4J

Tess4J 是 Tesseract OCR 引擎的 Java 封装库,它让 Java 项目更轻松地实现 OCR(光学字符识别)功能。

下载 tessdata

下载地址:https://github.com/tesseract-ocr/tesseract/releases

看网上教程,要下载相应的语言包,下 chi_sim.traineddata 即可
在这里插入图片描述

Java 使用Tess4j 的 demo

pom.xml 中加入以下依赖:

<dependency>
    <groupId>net.sourceforge.tess4j</groupId>
    <artifactId>tess4j</artifactId>
    <version>4.5.4</version>
</dependency>

写一个main方法,使用 Tesseract OCR 引擎对图像进行文字识别

public class OcrExample {
    public static void main(String[] args) {
        // 设置图片文件路径
        File imageFile = new File("D:\\1.png");

        // Tesseract 是 Tess4J 提供的 OCR 引擎类,它封装了对 Tesseract OCR 引擎的调用
        ITesseract instance = new Tesseract();

        try {
            // 设置tessdata路径 最好写绝对路径
            instance.setDatapath("D:\\app\\tool\\tesseract-ocr\\tessdata");
            // 选择简体中文 Chinese simplified
            instance.setLanguage("chi_sim");

            // 进行OCR识别
            String result = instance.doOCR(imageFile);

            System.out.println("识别结果: " + result);
        } catch (Exception e) {
            System.out.println("OCR识别失败: " + e.getMessage());
        }
    }
}

图片:
在这里插入图片描述

结果:
在这里插入图片描述


http://www.kler.cn/a/465910.html

相关文章:

  • PHP7和PHP8的最佳实践
  • JAVA:Spring Boot 集成 Quartz 实现分布式任务的技术指南
  • zookeeper 数据类型
  • 法律专业legal case的留学论文写作技巧分析(1)
  • Lombok @Data无法 import 导入的问题解决办法
  • Trimble天宝X9三维扫描仪为建筑外墙检测提供了全新的解决方案【沪敖3D】
  • Lua开发环境如何安装?保姆级教程
  • 大数据-268 实时数仓 - ODS层 将 Kafka 中的维度表写入 DIM
  • Java编程规约:集合处理
  • 线性变换在机器学习中的应用实例
  • 深入AIGC领域:ChatGPT开发者获取OpenAI API Key的实用指南
  • 公司一个bug引出的对象判空、空指针异常话题之NUll、isEmpty()和“”区别
  • 【华为OD-E卷 - Linux发行版的数量 100分(python、java、c++、js、c)】
  • 【开源免费】基于SpringBoot+Vue.JS保密信息学科平台(JAVA毕业设计)
  • 电脑文件msvcp110.d丢失的解决方法
  • Transformer算法实现IMDB文本分类任务和WMT14机器翻译任务
  • 数据库进阶教程之存储过程(万字详解)
  • 021-spring-springmvc-组件
  • Java重要面试名词整理(二十):GatewaySkyWalking
  • ELK zookeeper kafka
  • 基于Matlab的变压器仿真模型建模方法(12):单相降压自耦变压器的等效电路和仿真模型
  • 供需平台信息发布付费查看小程序系统开发方案
  • Linux内核 -- Netlink多播组消息处理技术
  • STM32-笔记30-编程实现esp8266联网功能
  • Unity-Mirror网络框架-从入门到精通之Benchmark示例
  • [python SQLAlchemy数据库操作入门]-19.使用复合条件构建复杂查询