当前位置: 首页 > article >正文

SGMEA: Structure-Guided Multimodal Entity Alignment

3 Method

3.1 Problem Definition

3.2 Framework Description

总体框架如图2所示,由三个主要部分组成:初始嵌入采集模块、结构引导模块和模态融合模块。

3.3 Initial Embedding Acquisition

3.3.1 Structural Embedding

3.3.2 Relation, Attribute, and Visual Embedding 

3.4 Structure-guided

3.4.1 Structure-Guided Visual Embedding

3.4.2 Structure-Guided Attribute Embedding

3.4.3 不对关系应用结构引导的原因

我们选择不对关系应用结构引导,因为关系天然存在于两个相邻实体之间,并且已经通过它们的交互明确地建模。在图结构中,关系自然捕捉实体间的语义信息,因此额外的 GAT 引导是没有必要的。与属性或图像嵌入相比,关系的表示已经足够稳健,进一步的引导可能会引入冗余,或对模型性能产生负面影响。

3.5 Modality Fusion

在本模块中,我们遵循Chen等人(2023a)对vanilla Transformer进行调整(Zhou等人,2021)

3.5.1 Modal representation generation and interaction

 3.5.2 Multi-head cross-attention and processing

3.5.3 Fusion representation generation

 3.6 Optimization Objective


http://www.kler.cn/a/588173.html

相关文章:

  • ‌React Hooks主要解决什么
  • 使用unsloth进行grpo训练报错及解决方法
  • netty中黏包,半包
  • HDR图像处理:色调映射和色域映射参数
  • 蓝桥杯好题推荐----最大字段和
  • 使用生成对抗网络(GAN)进行人脸老化生成的Python示例
  • 【机器学习chp13--(下)】人工神经网络—优化算法
  • HCIP笔记整理(一)
  • conda的基本使用及pycharm里设置conda环境
  • AI绘画软件Stable Diffusion详解教程(11):图生图进阶篇(局部用上传蒙版重绘)
  • 7个 Vue 路由守卫的执行顺序
  • 为训练大模型而努力-分享2W多张卡通头像的图片
  • 蓝桥杯真题——洛谷 day 9 枚举、贪心、找规律
  • C语言之数据结构 顺序表的实现
  • 网页制作代码html制作一个网页模板
  • 【Agent】OpenManus-Tool 详细分析
  • 一周学会Flask3 Python Web开发-SQLAlchemy删除数据操作-班级模块
  • Ubuntu 下有线网络图标消失及无法连接网络的解决方案
  • Java 多线程编程:提升系统并发处理能力!
  • Touch panel功能不良分析