【实战指南】使用OpenVINO C# API轻松部署飞桨PP-OCRv4模型
作者:算力魔方创始人/英特尔创新大使刘力
《超4万6千星的开源OCR黑马登场,PaddleOCR凭什么脱颖而出?》收到了读者热烈反响,很多读者提出:如何在C#中部署飞桨PP-OCRv4模型?本文从零开始详细介绍整个过程。
一,什么是PP-OCRv4模型?
PP-OCRv4是PaddleOCR工具库的PP-OCR系列模型中,当前性能最优的一个。它在前代模型(PP-OCRv3)的基础上,针对检测模型和识别模型进行了数据、网络结构、训练策略等多个模块的优化,在多个应用场景中,精度均有大幅提升:
-
中文场景,相对于PP-OCRv3中文模型提升超4%;
-
英文数字场景,相比于PP-OCRv3英文模型提升6%;
-
多语言场景(支持韩语、日语、德语、法语等80种语言),平均准确率提升超8%。
PP-OCRv4是一个两阶段的OCR系统,包含检测模型、方向分类模型和识别模型。在检测和识别之间添加方向分类模型,将不同角度的文本检测框修正为水平检测框,方便识别模型完成行文本识别。
为了适应服务器和边缘端不同场景的部署需求,PP-OCRv4提供两种推理模型权重版本:
-
边缘端:中英文超轻量PP-OCRv4模型(16.1M) = 检测模型(4.7M) + 识别模型(10.0M) + 方向分类模型(1.4M)。Hmean:62.24%;ACC:70.1%。
-
服务器端:中英文高精度PP-OCRv4 server模型(199.4M) = 检测模型(110M) + 识别模型(88M) + 方向分类模型(1.4M)。Hmean:82.69%;ACC:84.04%。
PP-OCRv4模型详述链接:
https://github.com/PaddlePaddle/PaddleOCR/blob/main/docs/ppocr/blog/PP-OCRv4_introduction.md
PP-OCRv4模型的卓越性能使其在多个领域具有广泛的应用前景,如文档扫描、文字提取、智能表单填写、物流信息追踪、文档自动化处理、智能服务窗口、文献资料整理等等。本文将介绍使用OpenVINO™工具套件在英特尔® CPU、独立显卡、集成显卡和NPU上优化并部署飞桨PP-OCRv4模型。
PP-OCRv4模型在飞桨AIStudio星河社区范例项目:
https://aistudio.baidu.com/projectdetail/8770259
二,OpenVINO C# API简介
OpenVINO C# API是一个开源的 OpenVINO™ 的 .Net wrapper(包装器)项目,它基于最新的OpenVINO™ Runtime库开发,通过调用官方的OpenVINO™ C API ,允许开发者在 .NET 和 .NET Framework 环境中使用 C# 语言调用AI模型,并实现AI模型在英特尔® CPU、独立显卡、集成显卡、NPU上的推理加速。
OpenVINO™ C# API的GitHub仓:https://github.com/guojin-yan/OpenVINO-CSharp-API
三,搭建开发环境
请参考《C# 中使用OpenVINO™:轻松集成AI模型!》完成OpenVINO C# API开发环境搭建。然后,启动“命令提示符”,用命令创建“ppocrv4_csharp”推理项目:
dotnet new console -o ppocrv4_csharp -f net8.0
然后,进入“ppocrv4_csharp”目录,使用NuGet安装OpenVINO™ C# API,命令如下:
dotnet add package OpenVINO.CSharp.API
dotnet add package OpenVINO.runtime.win
dotnet add package OpenVINO.CSharp.API.Extensions.OpenCvSharp
dotnet add package OpenVINO.CSharp.API.Extensions.PaddleOCR
最后,安装OpenCvSharp 4.9.0版:
dotnet add package OpenCvSharp4 --version 4.9.0.20240103
dotnet add package OpenCvSharp4.runtime.win --version 4.9.0.20240103
完成PP-OCRv4的OpenVINO™ C# API开发环境安装。
四,编写C# PP-OCRv4推理程序
PP-OCRv4的范例程序已开源,请将代码仓克隆到本地:
git clone https://github.com/guojin-yan/PaddleOCR-OpenVINO-CSharp.git
接着,将“在线模型识别”范例代码拷贝到Program.cs中,如下所示:
最后,在VS Code中运行该代码,结果如下所示:
五,总结
使用OpenVINO C# API可以直接读入PP-OCRv4模型(无需转换),并能方便快捷的将PP-OCRv4模型用C#代码部署在英特尔® CPU、独立显卡、集成显卡、NPU等硬件上。
如果你有更好的文章,欢迎投稿!
稿件接收邮箱:nami.liu@pasuntech.com
更多精彩内容请关注“算力魔方®”!