当前位置: 首页 > article >正文

smell---Paddle-DI

跨模态文档智能大模型–Ernie-Layout

目标:提取文档中无结构或半结构化的知识

github项目地址
Paddle NLP
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

ERNIE-Layout基于Transformer Encode架构,并提出以下trick:
1、OCR工具提取信息
借助OCR工具提取图片中的文字及文字对应的坐标信息(bounding box)。例如:paddleOCR等.
2、复杂布局position_ids
ERNIE-Layout借鉴了 DeBERTa 的解耦注意力,依靠Layout-Parser来设计 position_ids。LayoutParser是借助于目标检测模型来提取重要的内容patch,从而避免了两列内容按行扫描的混乱结果。

参考文献

Layout-Parser:
论文
代码

文档智能之ERNIE-Layout 1
文档智能之ERNIE-Layout 2
写在RAGFlow开源2万星标之际

通用信息抽取 UIE

Paddle

参考1:
Paddlenlp与Paddlepaddle

参考2:
ERNIE预训练模型下载

参考3:
PaddleNLP 安装和配置指南
参考4:
paddlenlp教程文档


http://www.kler.cn/a/464527.html

相关文章:

  • AI代码开发实践-微信小程序开发
  • 《深入浅出HTTPS​​​​​​​​​​​​​​​​​》读书笔记(24):椭圆曲线密码学
  • Android授权USB使用权限示例
  • overleaf写学术论文常用语法+注意事项+审阅修订
  • 【Multisim用74ls92和90做六十进制】2022-6-12
  • Git命令行的使用
  • U盘提示格式化?原因、恢复方案与预防措施全解析
  • 数据挖掘——决策树分类
  • CodeFuse IDE 0.7 版本发布,支持 Lint Error 智能改写
  • 被裁20240927 --- 嵌入式硬件开发 STM32篇
  • 33.时间函数相关 C#例子
  • 使用Python类库pandas操作Excel表格
  • 安全对讲需求大增,遨游PDT数字集群对讲机如何担此重任?
  • uni-app开发-习惯养成小程序/app介绍
  • Spring AOP的工作原理和实现方式
  • pycharm如何拉取一个git项目,然后,修改后再上传到自建的项目中?
  • ArrayList 与 LinkedList 对比与源码解读
  • vue2实现excel文件预览
  • 鸿蒙应用开发搬砖经验之-ArkWeb加载页面的超简单示例
  • vue3 Suspense组件
  • 深入探究 Louvain 算法:从原理到实现
  • 电子电器架构 -- 什么是用于ADAS/AD系统的雷达?
  • JAVA创建绘图板JAVA构建主窗口鼠标拖动来绘制线条
  • 第二十五天 项目实践:图像分类
  • python学习笔记—12—
  • 设计模式 创建型 原型模式(Prototype Pattern)与 常见技术框架应用 解析