当前位置: 首页 > article >正文

MCA:用于图像识别的深度卷积神经网络中的多维协同注意力

摘要

大量先前的研究已经表明,注意力机制在提高深度卷积神经网络(CNNs)性能方面具有巨大潜力。然而,现有的大多数方法要么忽略了在通道和空间维度上同时建模注意力,要么引入了更高的模型复杂度和更重的计算负担。为了缓解这一困境,本文提出了一种轻量级且高效的多维协同注意力(MCA)机制,这是一种使用三分支架构几乎不增加额外开销的同时在通道、高度和宽度维度上推断注意力的新方法。对于MCA的核心组件,我们不仅开发了一种自适应组合机制,用于在压缩变换中融合双跨维度特征响应,从而增强特征描述符的信息性和判别性,还在激励变换中设计了一种门控机制,该机制自适应地确定交互作用的覆盖范围以捕获局部特征交互,从而克服了性能和计算开销权衡之间的矛盾。我们的MCA方法简单且通用,可以轻松地作为即插即用模块插入各种经典CNN中,并可以与原始网络以端到端的方式进行训练。在CIFAR和ImageNet-1K数据集上的图像识别的大量实验结果证明了我们的方法相对于其他最先进(SOTA)方法的优越性。此外,我们还通过可视化GradCAM++结果直观地了解了MCA的实际益处。代码可在https://github.com/ndsclark/MCANet上获取。

1 引言

卷积神经网络(CNNs)因其强大的表示能力而在计算机视觉领域得到了普遍应用,其不断发展也不断


http://www.kler.cn/a/465698.html

相关文章:

  • 贵州省贵安新区地图+全域数据arcgis格式shp数据矢量路网地名+卫星影像底图下载后内容测评
  • 力扣66 加一
  • Git 仓库与文件管理笔记
  • Android IO 问题:java.io.IOException Operation not permitted
  • 探索 Android Instant Apps:InstantAppInfo 的深入解析与架构设计
  • 数据看板如何提升决策效率?
  • MAC录屏QuikTimePlayer工具录屏声音小免费解决方案
  • 机器学习之模型评估——混淆矩阵,交叉验证与数据标准化
  • PyQt下载M3U8文件
  • TK730 不允许更改资源库或跨客户端定制
  • JavaEE 初阶:线程(2)
  • RabbitMQ的常见面试题及其答案的总结
  • 美团商家端 字符验证码 分析
  • 使用npm 插件[mmdc]将.mmd时序图转换为图片
  • VuePress2配置unocss的闭坑指南
  • 适配器模式(类适配器,对象适配器)
  • 高频java面试题
  • 用语言模型 GLM-Zero-Preview 来驱动战场推演
  • 数据挖掘——支持向量机分类器
  • Centos源码安装MariaDB 基于GTID主从部署(一遍过)
  • Redis面试相关
  • vue2框架配置路由设计打印单
  • 【Axios使用手册】如何使用axios向后端发送请求并进行数据交互
  • 利用PHP爬虫获取1688按关键字搜索商品:技术解析与实践指南
  • 【C语言程序设计——循环程序设计】枚举法换硬币(头歌实践教学平台习题)【合集】
  • 【HTTP和gRPC的区别】协议类型/传输效率/性能/语义/跨语言支持/安全性/使用场景/易用性对比