当前位置: 首页 > article >正文

EmguCV学习笔记 VB.Net 12.3 OCR

  版权声明:本文为博主原创文章,转载请在显著位置标明本文出处以及作者网名,未经作者允许不得用于商业目的。

EmguCV是一个基于OpenCV的开源免费的跨平台计算机视觉库,它向C#和VB.NET开发者提供了OpenCV库的大部分功能。

教程VB.net版本请访问:EmguCV学习笔记 VB.Net 目录-CSDN博客

教程C#版本请访问:EmguCV学习笔记 C# 目录-CSDN博客

笔者的博客网址:https://blog.csdn.net/uruseibest

教程配套文件及相关说明以及如何获得pdf教程和代码,请移步:EmguCV学习笔记

学习VB.Net知识,请移步: vb.net 教程 目录_vb中如何用datagridview-CSDN博客

 学习C#知识,请移步:C# 教程 目录_c#教程目录-CSDN博客

12.3 OCR       

EmguCV中使用Tesseract类         进行文字识别。

Tesseract类的构造函数:

Public Sub New (

         dataPath As String,

         language As String,

         mode As OcrEngineMode,

         Optional whiteList As String = Nothing,

         Optional enforceLocale As Boolean = true

)

参数说明:

  1. dataPath:存放语言识别模型文件的目录,该目录必须是tessdata。
  2. language:要用来识别的语言,例如简体中文是chi_sim.traineddata,英文是eng.traineddata。如果需要识别的内容包含多种语言,那么这里需要使用加号连接,如:chi_sim+eng,将加载简体中文和英语。需要注意的是,加载额外的语言将影响速度和准确性。
  3. mode:OCR引擎模式。这是一个OcrEngineMode枚举,它包含四个成员:TesseractOnly:速度最快;LstmOnly:精度最好,但是速度慢;TesseractLstmCombined:速度和精度比较平衡;Default:自动选择上述三种引擎。
  4. whiteList:用于指定OCR的白名单。例如,指定“1234567890”仅识别数字。请注意,白名单目前只适用于OcrEngineModel.OEM_TESSERACT_only
  5. enforceLocale:指定是否强制使用特定的区域设置。当设置为 True 时,Tesseract将强制使用特定的区域设置,这意味着它将使用与指定区域设置相关的语言模型和字典进行文本识别。例如,如果您希望在美国使用 Tesseract,可以将 enforceLocale 参数设置为 True,并将区域设置设置为 "en_US"。这样,Tesseract 将使用与美国英语相关的语言模型和字典进行文本识别,从而提高识别准确性。相反,如果将 enforceLocale 参数设置为 False,Tesseract 将不会强制使用特定的区域设置,而是使用默认的区域设置进行文本识别。

具体操作步骤:

经过构造函数后,通过SetImage方法传入需要OCR的图像,Recognize方法识别图像,但是该方法不会直接返回结果,而是通过GetUTF8Text方法获得识别出的字符串,或者通过GetCharacters方法获得Tesseract.Character结构数组,Tesseract.Character结构包含了识别出的字符串和字符串所在的区域坐标。

【代码位置:frmChapter12】Button4_Click

    'OCR识别

    Private Sub Button4_Click(sender As Object, e As EventArgs) Handles Button4.Click

        '使用中文

        Dim ocr As New Tesseract("C:\learnEmgucv\tessdata", "chi_sim", OcrEngineMode.LstmOnly)

        '如果中英文都要使用,那么使用加号连接。但不要超过2个语言。

        'Dim ocr As New Tesseract("C:\learnEmgucv\tessdata", "chi_sim+eng", OcrEngineMode.LstmOnly)

        Dim m As New Mat("C:\learnEmgucv\ocr2.jpg", ImreadModes.Color)

        ImageBox1.Image = m

        '设置需要识别文字的图像

        ocr.SetImage(m)

        '识别

        ocr.Recognize()

        '获得识别结果

        Dim textout As String

        textout = ocr.GetUTF8Text

        Console.WriteLine(textout)

        '标记识别区域

        Dim charout() As Tesseract.Character

        charout = ocr.GetCharacters

        For i As Integer = 0 To charout.Length - 1

            CvInvoke.Rectangle(m, charout(i).Region, New MCvScalar(0, 0, 255), 1)

        Next

        ImageBox2.Image = m

End Sub

输出结果如下图所示:

 

图12-4 OCR获得图像中的文字

需要注意的是,识别结果和传入的图像质量有关系,请在识别前做好图像处理。


http://www.kler.cn/news/313335.html

相关文章:

  • OpenAI GPT o1技术报告阅读(4)- 填字游戏推理
  • 【Git 操作】Git 的基本操作
  • Elasticsearch:检索增强生成背后的重要思想
  • 【VUE3.0】动手做一套像素风的前端UI组件库---先导篇
  • 社团周报系统可行性研究-web后端框架对比-springboot,django,gin
  • Linux内核学习之 -- ARMv8中的Current宏
  • 自注意力与多头自注意力的区别
  • Go进阶概览 -【7.2 泛型的使用与实现分析】
  • 网络穿透:TCP 打洞、UDP 打洞与 UPnP
  • SAP HCM 组织增量解决方案
  • FSFP——专为蛋白质工程设计的少样本学习策略
  • SpringMVC1~~~
  • 回归预测 | Matlab实现SSA-HKELM麻雀算法优化混合核极限学习机多变量回归预测
  • 动手学深度学习(五)循环神经网络RNN
  • 吃透这本大语言模型入门指南,LLM就拿下了
  • 【Kubernetes】常见面试题汇总(二十八)
  • RedisTemplate操作ZSet的API
  • 《让手机秒变超级电脑!ToDesk云电脑、易腾云、青椒云移动端评测》
  • 数据结构和算法之树形结构(1)
  • (2)leetcode 234.回文链表 141.环形链表
  • 机器翻译之创建Seq2Seq的编码器、解码器
  • 使用SonarQube扫描ESP32项目,如何生成build-wrapper-dump.json
  • PyTorch 图像分割模型教程
  • SpringBoot 项目如何使用 pageHelper 做分页处理 (含两种依赖方式)
  • 【Redis入门到精通二】Redis核心数据类型(String,Hash)详解
  • Kafka 命令详解及使用示例
  • 半导体器件制造5G智能工厂数字孪生物联平台,推进制造业数字化转型
  • java--章面向对象编程(高级部分)
  • 在 Debian 12 上安装 Java 21
  • 【VUE3.0】动手做一套像素风的前端UI组件库---Button