当前位置: 首页 > article >正文

业务效果提升10%,效率翻倍!PP-OCRv4助力提升政务文档处理能力

f4bbc4c510177991f1185e7eee1cd93b.gif

政府机构在数字化转型过程中,每天都会产生和接收大量的文档,包括公文、申请材料、报告等。这些文档通常以非结构化的形式存在,难以直接进行分析和利用。而OCR可以通过文字识别技术,将这些非结构化的数据转化为结构化的信息,从而方便政府机构进行数据治理和决策分析。

当前政务文档在文字识别中的挑战主要有:

  • 来源多元化:有电子文档,扫描件,手机拍摄的文档,文档质量参差不齐。

  • 文字格式多样化:包括手写、印刷、盖章内容等,需要进行多种文字识别技术的应用。

  • 内含大量专业术语:需要对这些术语进行识别和处理。

  • 原始格式不规范:可能存在缺失、错位等问题,需要进行处理和修复。

因此,选择一种既能大规模支持各种文档识别、识别精度高,又能方便管理、降本增效的识别应用,显得尤为重要。

针对以上的行业需求,飞桨联合旻浦科技提供了一套基于PaddleX(飞桨AI套件)的完整的政务文档处理方案,可利用模型库中PP-OCRv4的高精度识别能力,准确提取各种电子文档材料的核心信息,形成标准化的产品,助力政府政务治理,提升数字化服务能力。同时,旻浦科技也加入星河共创计划,将第一阶段共创成果已上线至PaddleX应用官网,访问下方链接即可了解更多~

项目链接:基于PP-OCRv4的文档场景检测识别 - 飞桨AI Studio星河社区

735b48925f1d8efa7edb79c30920845c.png场景痛点

  • 准确性低:OCR通用能力相对较弱,造成结构化信息提取准确性低,影响后续整个链条的工作。

  • 实施周期长:工作覆盖了电子文档资料治理的整个业务链条,实施周期长。

  • 人力投入大:公司专门成立算法团队,负责电子文档资料的算法模型设计、学习训练等,人力投入一直较大。

35d209f081941754345efbf0d5a6d3f1.png方案设计与优势

针对以上问题,旻浦科技基于PaddleX中PP-OCRv4模型的基础能力,将10万份证照类、文本类电子文档材料通过分类、检测、识别、提取,输出结构化信息。飞桨解决基础性、公共性通用能力,旻浦科技专注于业务分析、创新应用能力,双方彼此链接、相互促进,最终赋能政务工作,实现“AI+政务”智能升级。

如下所示,PP-OCRv4整体的框架图保持了与PP-OCRv3相同的pipeline,针对检测模型和识别模型进行了数据、网络结构、训练策略等多个模块的优化。

0704a06ecc1be259e5163eb29c581c4f.png

PP-OCRv4系统框图

PP-OCRv4效果速览:

9024e9f7180f6941a9dffc0cb29d753a.jpeg

f458db77d0932aa2227514e7f087644d.png

c5931b49653c61cfcad1a8d4d39aa465.png

  • 关于PP-OCRv4详情特性解析,可访问链接:再升级!PP-OCRv4多场景平均精度提升5%!

b5fab5850bd3d4b08d636abfe3f97bca.png应用效果

效果一:精度提高、应用效果显著

  • 电子文档材料识别:精度从92%左右提高到98%以上。

  • 智能政务应用效果:申请表数据自动填充率从50%左右提高到70%以上;智能预审通过率从90%左右提高到98%以上。

效果二:效率提升、上线周期缩短

在智能预审和智能帮办的常规项目及30个高频服务事项中,应用PP-OCRv4后,开发到上线的时间成本缩短1.5个月左右。

效果三:成本降低、综合效益提升

效率提高、人力成本降低,研发团队从原来10人左右算法工程师缩减至4人。

ca17898300aa1b69d860761fd9059132.png精彩直播预告

为了让广大开发者和企业更详细了解到PP-OCRv4在政务领域的具体应用以及如何助力业务实现降本增效,旻浦科技数字政府研究院院长姜德峰将于10月26日(周四)19:00为大家带来一期精品课程,以旻浦科技的政务领域为例,详解企业如何利用科技赋能,实现企业数字化转型新思路。

扫描海报下方二维码,进群获取直播最新动态~

f925bbface0fc3111561d6bf7d1b7d2b.jpeg

1e0221ae38898bb39a579c463c20d3b4.png加入星河共创计划

成为文心生态伙伴

除了可以更便捷地开发AI模型和应用外,星河共创计划为企业提供了企业扶持和商业收益的机会。

1.有意向基于文心大模型(ERNIE Bot SDK、文心一言等)共创应用和插件,可以获取百亿流量、项目奖金等福利。

2.基于文心大模型和PaddleX(飞桨AI套件)共创应用上线至星河社区,可以拟定应用价格,开放给其他用户购买,获得应用收入分成。

通过星河共创计划,成为文心生态伙伴,助力企业快速实现行业痛点解决、大模型业务落地、客户拓展和商业收入。欢迎扫描下方二维码了解星河共创计划,回复“共创”即可。我们期待与您携手,发掘更多经典场景案例!

583b75955aea515c7524459e98f07b69.png

相关地址直达:

1.PaddleX中的PP-OCRv4:

基于PP-OCRv4的文档场景检测识别 - 飞桨AI Studio星河社区

2.PaddleX官网:

飞桨AI Studio星河社区-人工智能学习与实训社区

3.PaddleX官方频道:

飞桨AI Studio星河社区-人工智能学习与实训社区

4.PaddleX共创方案:

https://ai.baidu.com/ai-doc/AISTUDIO/pll1ysj35

5.PaddleX使用文档:

https://ai.baidu.com/ai-doc/AISTUDIO/Zlisojzjs

cdd6ea7ee5a20b646381a8fd671c44f3.png

ca2abb26d232057a88997aee3d060f44.jpeg

7e75f16c83cd92988b284a4c93dc1972.jpeg

56e1e7f7106c8fe4ec74d5963e2b95d8.jpeg

ad41bad90970a8831408d62c42d80d8d.gif

关注【飞桨PaddlePaddle】公众号

获取更多技术内容~


http://www.kler.cn/a/104365.html

相关文章:

  • 创建 Edge 浏览器扩展教程(上)
  • 凉鞋的 Unity 笔记 204. 语句
  • Linux下磁盘备份、文件备份和定时备份命令指南
  • docker指令
  • 第20章 Netty
  • 【C语言初阶】switch语句的基本语法
  • Modeling Deep Learning Accelerator Enabled GPUs
  • 大热电视剧《好事成双》里的IT故事:用户数据泄露事件引出的美女黑客
  • 文件的常用操作(读取压缩文件、解压、删除)
  • 工作中出现什么「迹象」,表明你应该换工作了?
  • 自动驾驶之—2D到3D升维
  • 分享6款文字语音生成驱动虚拟数字人说话的开源项目
  • FLStudio21汉化破解激活版下载,Fl Studio 2024中文破解版激活补丁
  • 支持向量机(SVM)
  • OpenLayers入门,快速搭建vue+OpenLayers地图脚手架项目
  • React中的受控组件(controlled component)和非受控组件(uncontrolled component)
  • 解决netty作为web,post请求体过大导致413 Request Entity Too Largew问题
  • C++中的智能指针:更安全、更便利的内存管理
  • RabbitMQ原理(五):消费者的可靠性
  • 使用element-UI Cascader组件,实现第一级单选选,第二级,第三级,子级可以多选