当前位置: 首页 > article >正文

tesseract:一个.Net版本的开源OCR项目

推荐一个.Net版本的开源OCR项目,方便我们在项目中集成OCR功能。

01 项目简介

tesseract是针对Tesseract-OCR(C++)引擎封装的.NET版本,支持超过100种语言的文本识别,使得.NET开发者能够轻松地利用Tesseract的强大功能,无需深入了解OCR的底层技术。

此项目缺点是,只能识别印刷的文本,针对手写的需要自己训练语言包。

02 使用方法

1、安装依赖Tesseract

Install-Package Tesseract

2、下载语言数据文件

根据需求下载对于的语言数据文件,并在属性设置“复制到输出目录”设置为“始终”,如下示例为中文简体数据文件。

图片

语言文件下载地址:

https://github.com/tesseract-ocr/tessdata_fast

3、示例代码

using System.Diagnostics;
using Tesseract;

var testImagePath = "./photo.bmp";

try
{
    using (var engine = new TesseractEngine(@".", "chi_sim", EngineMode.Default))
    {
        using (var img = Pix.LoadFromFile(testImagePath))
        {
            using (var page = engine.Process(img))
            {
                var text = page.GetText();

                Console.WriteLine("识别结果:" + text);
            }
        }
    }
}
catch (Exception e)
{
    Console.WriteLine(e.ToString());
}
Console.ReadKey(true);

4、识别效果

图片:

图片

识别:

图片

03 项目地址

https://github.com/charlesw/tesseract

- End -

更多开源项目: https://github.com/bianchenglequ/NetCodeTop

我是编程乐趣,一个.Net开发经验老程序员,欢迎“关注”我,每天为你分享开源项目和编程知识。
也欢迎加入【.Net技术编程交流社区】,和大家共同学习交流!,点击加入:https://bbs.csdn.net/topics/613465368

推荐阅读

2个零基础入门框架教程!

一个C#开源工具库,集成了超过1000个扩展方法

Sep:一个低内存、高性能的CSV文件读写操作.Net开源库

Boxed:包含多个.Net项目模板,涵盖了ASP.NET Core API、GraphQL等。

Atata:一个基于 Selenium的C#自动化测试Web框架


http://www.kler.cn/a/327101.html

相关文章:

  • vsCode怎么使用vue指令快捷生成代码
  • 华为IPD流程6大阶段370个流程活动详解_第一阶段:概念阶段 — 81个活动
  • Idean 处理一个项目引用另外一个项目jar 但jar版本低的问题
  • YOLO-World:Real-Time Open-Vocabulary Object Detection
  • 免费GIS工具箱:轻松将glb文件转换成3DTiles文件
  • Go 1.24即将到来!
  • element-plus 日历组件 Calendar设置每周第一天为周一-非国际化版
  • MobaXterm基本使用 -- 服务器状态、批量操作、显示/切换中文字体、修复zsh按键失灵
  • 从0学习React(3)
  • C# 解决Excel边框样式无法复制问题及实现格式刷功能
  • 前端DOM常用操作
  • 什么是IIC通信协议?
  • JAVA姓氏头像情侣头像家庭头像签名头像谐音顽埂头像设计小程序头像大全系统小程序源码
  • sentinel2 L2A处理基线04.00 反射率计算方法
  • 【MySQL】视图和触发器
  • 使用代理爬取数据需要筛选合适的ip吗
  • C++11 多线程编程-小白零基础到手撕线程池
  • 【VUE】案例:商场会员管理系统
  • find()和findIndex()方法
  • 微信小程序——音乐播放器
  • 【有啥问啥】二分图(Bipartite Graph)算法原理详解
  • SpringMVC源码-AbstractUrlHandlerMapping处理器映射器将实现Controller接口的方式定义的路径存储进去
  • 健康生活,从日常细节开始
  • NVLM多模态 LLM 在图像和语言任务中的表现优于 GPT-4o
  • Oracle数据恢复—异常断电导致Oracle数据库报错的数据恢复案例
  • 第167天:应急响应-日志自动提取分析项目_ELK_Logkit_LogonTracer_Anolog等