当前位置: 首页 > article >正文

DeepLearning:卷积神经网络基础补充

卷积神经网络基础补充:

文章目录

      • 误差的计算
        • 例子
        • 交叉熵损失
        • 损失公式
        • 误差反向传播(链式求导)
      • 权重的更新
      • 优化器(optimazer)
        • SDG优化器(Stochastic Gradient Descent)
        • SGD+Momentum优化器
        • Adagrad优化器(自适应学习率)
        • RMSProp优化器(自适应学习率)
        • Adam优化器(自适应学习率)
        • 几个优化器的比较
        • 几个优化器的比较

img

误差的计算

img

例子

img

img

img

经过softmax处理后所有输出节点概率和为1(归一化)

img

交叉熵损失

img

损失公式

img

误差反向传播(链式求导)

img

img

img

img

权重的更新

img

在实际应用中往往不可能一次性将所有数据载入内存(算力也不够),所以只能分批次(batch)训练。

ps:ImageNet项目是一个用于视觉对象识别软件研究的大型可视化数据库。超过1400万的图像被ImageNet手动注释,以指示图片中的对象。

  • 若使用整个样本集进行求解损失梯度指向全局最优方向

  • 若使用分批次样本进行求解,损失梯度指向当前批次最优方向,训练过程更不平稳

img

优化器(optimazer)

作用:使网络得到更快的收敛

img

  1. SDG优化器(Stochastic Gradient Descent)

缺点:易受样本噪声影响(有些数据标注错误),可能陷入局部最优解(按batch分批次)

img

  1. SGD+Momentum优化器

img

  1. Adagrad优化器(自适应学习率)

img

St是不断累计的损失梯度的平方和,初始化为0

  1. RMSProp优化器(自适应学习率)

img

  1. Adam优化器(自适应学习率)

img

几个优化器的比较

img

几个优化器的比较

Adam效果比较好,一些论文里面常用的还是SGD,根据具体情况选择


http://www.kler.cn/a/591824.html

相关文章:

  • python实现接口自动化
  • Paper Reading: AnomalyGPT:利用大型视觉-语言模型检测工业异常 (AAAI 2024 Oral)
  • 20. Excel 自动化:Excel 对象模型
  • Springboot中的@ConditionalOnBean注解:使用指南与最佳实践
  • 4.2 Reactive 对象的深度类型约束方案
  • linux 命令 cp
  • Pycharm接入DeepSeek,提升自动化脚本的写作效率
  • 基于YOLOv8深度学习的PCB缺陷检测识别系统【python源码+GUI界面+数据集+训练代码】
  • C# BindingFlags 使用详解
  • 在linux 系统下的qt 安装mqtt库
  • maven在idea上搭建
  • flutter 专题 九十八 Flutter 1.7正式版发布
  • WPF 开发从入门到进阶(五)
  • JAVA EE(9)——线程安全——锁策略CAS
  • 【安全运营】用户与实体行为分析(UEBA)浅析
  • Lua语言的自动化测试
  • 【python】带有\n的json字符串,如何优雅打印
  • goweb中文件上传和文件下载
  • 监控视频联网平台在智慧水利中的应用
  • 技术革命、需求升级与商业生态迭代——基于开源AI大模型与智能商业范式的创新研究