DocFlow票据AI自动化处理工具,提升企业票据数字化管理效能
随着全球化与信息化进程,企业的文件、信息、数据吞吐量不断增长,2020年以来,业务形势的变革再次加速了企业对先进的文档数字化管理解决方案需求。其中,票据处理始终面临着文件量大耗时、单据高度多样化、“淡旺季”周期波动性强、容错率低、文档结构化水平低等艰巨挑战。DocFlow在实际业务需求下打磨诞生,为票据自动化处理场景量身打造。
Doclfow的工作流程如下:
✔ 输入文档:支持扫描上传、邮箱收票、SFTP定时、SMB共享、OneDriver、Sharepoint、API调用等多种方式。
✔ 文件质量优化:基于TextIn图像处理技术,支持切边增强、多图切分、水印去除、印章检测、多套拆分等优化操作
✔ 文档分类:可根据需求,建立Invoice、Purchase Order、Debit Note、Credit Note、Credit Note、CN_VAT及其他分类
✔ 抽取定位显示:我们通过DocFlow工作空间直观展示票据字段抽取的形式,用户也可以自定义字段。
✔ 人工确认验证:业务人员可以对抽取结果进行核对确认。DocFlow标准化工具拥有免训练开箱即用、灵活配置、产品组件化、集成便捷等特点。
在DocFlow背后支撑其优秀产品表现的,是TextIn出色的文档解析和抽取能力。
TextIn通用文档解析工具利用强大的文字识别和文档理解能力,识别文档或图片中的文字信息,并按常见的阅读顺序进行还原,支持 PDF、Word(doc / docx)、常见图片(jpg / png / webp / tiff)、HTML 等文件格式。支持标准的金融报告、国家标准、论文、企业招投标文件、合同、文书、工程图纸等文档内容,广泛应用于信息管理、数据清洗、企业合规、研究分析等多个领域。
解析工具以多文档元素识别能力、物理与逻辑版面分析关键技术为核心,突破多项技术难点,具备全量的扫描件识别能力;拥有精准的表格还原能力,面对无线表、跨页表格、合并单元格、密集表格、手写字符、公式等解析难点,也能准确识别;对多栏、多图表的复杂版面文件进行阅读顺序还原,支持Markdown、Json等多种格式输出,满足下游数据处理及业务需求。
TextIn文档解析算法框架
TextIn智能文档抽取能力,依托自研的垂直领域语义模型,基于海量的基础数据完成预训练,具备极强的泛化性,无需标注训练,开箱即用,即可达到精准的抽取效果。
非结构化文档抽取的瓶颈之一在于对文档复杂版面解析的准确性,例如文档中插入的各类复杂表格,TextIn对表格结构的准确还原技术是进行信息结构化抽取的前提。文档抽取支持PDF电子件、拍摄件、扫描件等不同格式的文档,手写体、印章、表格等不同类型的元素的智能抽取,兼顾短文本与长文本,既支持单页的非标卡证、票据、表单,如海外invoice、国际信用证、电汇凭证、不动产权证等,也支持几十甚至上百页的长文档,如购销合同、借款合同、基金合同等。
基于专业的文档解析和抽取能力,DocFlow能在多样化的场景下实现高效、稳定的票据自动化处理,满足业务需求。
以两个常见场景为例:
财务应付
在应付账款的处理工作中,发票、采购订单、合同、出入库单据的匹配会消耗大量人力。对于涉及跨国业务的企业,该问题更为显著,普通自动化系统往往无法处理版式差异非常大的不同国家发票、单据,需要人工分拣并处理。
DocFlow能够辅助高效处理发票、匹配采购订单等交易材料,识别差异,减少人工核对可能出现的误差,验证付款并确保及时收款,提供实时报告,保持合规性,加快审批并改进现金流管理。DocFlow也支持以插件形式便捷添加到现有系统中,兼容多种票据,同样适用于企业费用报销流程。
金融信贷业务
金融业务贷中审核环节,金融机构专注于业务流、信息流、物流、现金流的数据整合及交叉验证,但在产业端数字化水平有限以及合规审核要求严格的背景下,审核人员需要对业务合同、发票、运输单等大量纸质材料的关键信息进行细致的审核校验和交叉比对、认定此次业务的资产信息,继而通过动产融资统一登记公示系统对拟登记资产进行查重以确认其有效性,整个贷中审核过程耗费审核人员大量的时间和精力。
DocFlow可以通过快速评估申请人资料、评估风险因素、利用数据分析和生成审批建议,提高决策效率,同时确保合规性。此外,在保险理赔、进出口物流等涉及大量单据流转及核对任务的场景中,DocFlow也能帮助减少管理文件和数据难度,提高后台办公效率。
目前,DocFlow已投入部分跨国公司业务使用,我们收集到以下客户反馈总结
- 在某集成电路龙头企业应用中,每单平均处理时间预期从30分钟降低至3分钟,10倍效率提升
- 避免录入的过程中的人工出错
- 历史数据可追溯,方便后期回溯
- 在某汽车行业跨国企业应用中,中国税法的合规稽核通过率99%