当前位置: 首页 > article >正文

ResEmoteNet论文阅读与推理

论文题目:ResEmoteNet: Bridging Accuracy and Loss  Reduction in Facial Emotion Recognition

领域:面部情绪识别

数据集:​AffectNet 、 ​RAF-DB 、 FER2013  、​ ExpW

模型架构:CNN+SE Block(Squeeze excitation) + Resnet+AAP

论文中的SE Block压缩激励结构如下:

ResEmoteNet的整体框架如下:

(1)CNN 模块,该模块具有三个卷积层,用于分层特征提取,然后进行批量归一化,以稳定学习并提高训练效率。在每一层之后应用 Max-pooling 以减少空间维度,降低计算成本并引入平移不变性以提高鲁棒性。

(2)SE模块,Squeeze使用全局平均池化将来自每个通道的空间数据压缩为全局描述符。 Excitation使用激活的门控机制来捕获通道依赖关系。SENet 的方法允许网络学习一系列注意力权重,突出每个输入元素对网络输出的重要性。

(3)残差Residual模块,解决神经网络中梯度消失和爆炸的常见问题。

(4)Adaptive Average Pooling(自适应平均池化) 是 CNN 中使用的一种池化层,无论原始输入维度如何,它都可以将输入信息聚合为恒定的输出大小。AAP 调整内核大小和步幅以达到特定的输出大小,而不是像传统的池化方法那样减小空间维度。它确保各种数据集和图层中的输出维度一致。

推理过程与结果:

GitHub:https://github.com/ArnabKumarRoy02/ResEmoteNet

下载预训练模型:ResEmoteNet Checkpoints - Google 云端硬盘

打开文件./eval_image.py,第16行代码:

checkpoint = torch.load('path/to/fer2013_model.pth', weights_only=True,
                        map_location=torch.device('cpu'))

第80行代码:

# Load the image file
image = cv2.imread('path/to/test1_image.jpg')

保存并运行该文件:

python eval_image.py

测试图像是这个:

测试结果如下:


http://www.kler.cn/a/451468.html

相关文章:

  • Django 模型中使用选择(choices):全面指南
  • postgresql ERROR: cannot drop the currently open database
  • VSCode 性能优化指南:提高编码效率,减少资源占用
  • 【NLP 17、NLP的基础——分词】
  • 14-zookeeper环境搭建
  • f(f(x))=x^2 -11x+36, 求f(6)的值,
  • 【可视化开源性能压测工具】小巧而强大的oha
  • 【数据结构2】线性表——顺序表
  • 动态规划:石子合并 图文+举例超详细说明
  • OpenCV相机标定与3D重建(26)计算两个二维点集之间的部分仿射变换矩阵(2x3)函数 estimateAffinePartial2D()的使用
  • AWTK 在树莓派 pico 上的移植笔记
  • HTMLCSSJavaScriptDOM 之间的关系?
  • 组态页面渲染器通过npm包方式使用页面没有渲染成功的问题
  • gesp(三级)(14)洛谷:B4039:[GESP202409 三级] 回文拼接
  • 贪心算法求解加油站问题
  • 《ROS2 机器人开发 从入门道实践》 鱼香ROS2——第4章内容
  • WebAuthn 项目常见问题解决方案
  • C++抽象类与类继承相关注意事项 [学习笔记]
  • select 1 from table的作用 详解
  • 【ue5学习笔记2】在场景放入一个物体的蓝图输入事件无效?
  • sentinel学习笔记8-系统自适应与黑白名单限流
  • LabVIEW实现GSM/GPRS通信
  • LeetCode 3138.同位字符串连接的最小长度:计数(一个数最多128个因数)
  • Python中定位元素包含文本信息的详细解析与代码示例
  • QWebChannel实现与JS的交互
  • 使用React构建一个掷骰子的小游戏