信息搜集250102
系列博客目录
文章目录
- 系列博客目录
- 1.关于多模态 去噪的最新的论文
- 2.A Dual-Module Denoising Approach with Curriculum Learning for Enhancing Multimodal Aspect-Based Sentiment Analysis
- 摘要
- 引言
- 3.AoM: Detecting Aspect-oriented Information for Multimodal Aspect-Based Sentiment Analysis AoM:检测面向情感的信息,用于基于情感的多模态情感分析
- 4.
- 5.
- 6.
- 7.
- 8.
- 9.
- 10.
1.关于多模态 去噪的最新的论文
以下是一些关于多模态去噪的最新研究论文,涵盖了推荐系统、生成模型、图像增强、轨迹预测等领域,供您参考:
-
DDRec: Dual Denoising Multimodal Graph Recommendation
- 提出了双去噪多模态图推荐模型,设计了两种去噪方法以应对多模态特征噪声。
- 来源:IEEE Transactions on Knowledge and Data Engineering (2024)
论文链接
-
SOWing Information: Cultivating Contextual Coherence with MLLMs in Image Generation
- 利用多模态大语言模型进行图像生成,结合信息交互实现更高的去噪效果。
- 来源:arXiv (2024)
论文链接
-
Prompt Conditioned Batik Pattern Generation using LoRA Weighted Diffusion Model
- 研究了基于扩散模型的多模态去噪,主要应用于弱监督视频解析。
- 来源:IEEE (2024)
论文链接
-
Unified Image Restoration and Enhancement
- 提出了一种基于退化校准循环重建扩散模型的统一图像增强方法。
- 来源:arXiv (2024)
论文链接
-
ACDiT: Interpolating Autoregressive Conditional Modeling and Diffusion Transformer
- 探讨了多模态扩散变换器在时间序列预测中的应用。
- 来源:arXiv (2024)
论文链接
-
TDiffSal: Text-Guided Diffusion Saliency Prediction Model for Images
- 利用文本引导扩散模型预测图像显著性,显著提高去噪过程的效率。
- 来源:Springer (2024)
论文链接
-
Beyond Graph Convolution: Multimodal Recommendation with Topology-aware MLPs
- 提出了一种多模态推荐系统,通过拓扑感知的MLP改进去噪性能。
- 来源:arXiv (2024)
论文链接
-
A Dual-Module Denoising Approach for Multimodal Aspect-Based Sentiment Analysis
- 提出了双模块去噪方法以增强多模态情感分析。
- 来源:arXiv (2024)
论文链接
这些论文展示了多模态去噪技术在不同领域的最新进展和应用,如果需要更详细的摘要或分析,请告诉我!
2.A Dual-Module Denoising Approach with Curriculum Learning for Enhancing Multimodal Aspect-Based Sentiment Analysis
摘要
多模态基于方面的情感分析(MABSA)结合文本和图像执行情感分析,但常常受到无关或误导性视觉信息的影响。现有的方法通常分别处理句子-图像去噪或方面-图像去噪,但未能全面解决这两种类型的噪声问题。为了解决这些局限性,我们提出了一种名为DualDe的新方法,该方法由两个独立的组件组成:混合课程去噪模块(HCD)和方面增强去噪模块(AED)。HCD模块通过引入一种灵活的课程学习策略,优先处理干净数据,从而增强句子-图像的去噪能力。同时,AED模块通过一种方面引导的注意力机制减轻方面-图像噪声,过滤掉与特定分析对象无关的噪声视觉区域。实验结果表明,我们的方法在处理句子-图像噪声和方面-图像噪声方面均表现出色,并在基准数据集上的实验评估中证明了其有效性。
引言
情感分析是自然语言处理(NLP)中的一项基础任务 (Zhang and Liu, 2012),旨在揭示和解释用户生成内容中包含的观点、态度和情感。多模态基于方面的情感分析(MABSA)在传统情感分析的基础上,结合文本和视觉模态,从而实现对情感更深入和全面的理解。MABSA通常分为三个主要子任务:
- 多模态方面术语提取(MATE):该任务侧重于从文本中识别和提取与特定方面相关的术语 (Wu et al., 2020a)。
- 多模态方面导向情感分类(MASC):此任务的目标是将每个方面术语的情感分类为正面、中性或负面等类别 (Yu and Jiang, 2019)。
- 联合多模态方面情感分析(JMASA):同时解决方面提取和情感分类问题,为方面和情感提供统一的分析 (Ju et al., 2021)。
在实际场景中,并非所有图像都与其对应的文本相关,有些甚至会误导句子的上下文和情感理解。对于与文本相关的图像来说,图像中的所有视觉块也并不都与所关注的方面密切相关,事实上,往往会有一些块引入噪声。在真实场景中,伴随文本的图像可能并非总是相关,有时甚至会误导句子语境和情感的解读。即使图像是相关的,其中的所有视觉元素也未必与关注的方面相关,经常会引入噪声。为了解决这些挑战,现有方法通常侧重于句子-图像去噪或方面-图像去噪。例如,(Ju et al., 2021) 和 (Sun et al., 2021) 等研究通过检测文本与图像的关系来过滤无关的视觉信息,但可能会遗漏在被认为无关的图像中存在的重要细节。(Zhao et al., 2023) 使用课程学习逐步将模型暴露于含噪图像中,但其固定的噪声度量方法限制了灵活性。另一方面,(Zhang et al., 2021) 和 (Yu et al., 2022) 的方法专注于视觉对象与特定词汇之间的交互,而 (Zhou et al., 2023) 使用了方面感知注意力模块来实现精细的对齐。尽管这些方法各有优势,但它们往往忽视了句子-图像去噪的重要性,如图1所示。
图1:句子-图像去噪和方面-图像去噪的示意图。
句子-图像去噪:当图像与整体句子含义相关时,将其分类为“干净”。
方面-图像去噪:当图像中的某些区域(例如模糊区域)与特定方面没有强相关性时,将这些区域识别为噪声。
在本文中,我们提出了一种名为DualDe的高级方法,旨在全面解决句子-图像噪声和方面-图像噪声问题。DualDe 集成了两个主要组件:混合课程去噪模块(HCD)和方面增强去噪模块(AED)。
- 混合课程去噪模块(HCD):通过采用灵活的课程学习方法,动态调整噪声度量标准(基于模型性能和预定义标准),从而提升适应性并改进句子-图像去噪能力。
- 方面增强去噪模块(AED):利用方面引导的注意力机制,选择性过滤掉与每个特定方面无关的视觉区域和文本标记,从而改善图像-文本对齐效果。
我们的主要贡献总结如下:
- 首创性:据我们所知,DualDe 是首个能够同时解决句子-图像噪声和方面-图像噪声的模型。
- 创新模块:我们引入了混合课程去噪模块(HCD),在训练框架中有效平衡了模型的泛化能力和适应能力。
- 实验验证:通过在 Twitter-15 和 Twitter-17 数据集上的广泛实验,验证了我们方法的有效性。