当前位置：首页 > article >正文

DeepLearning：卷积神经网络基础补充

article 2025/3/20 0:01:36

卷积神经网络基础补充：

文章目录

- - 误差的计算
  - - 例子
    - 交叉熵损失
    - 损失公式
    - 误差反向传播（链式求导）
  - 权重的更新
  - 优化器（optimazer）
  - - SDG优化器（Stochastic Gradient Descent）
    - SGD+Momentum优化器
    - Adagrad优化器（自适应学习率）
    - RMSProp优化器（自适应学习率）
    - Adam优化器（自适应学习率）
    - 几个优化器的比较
    - 几个优化器的比较

误差的计算

例子

经过softmax处理后所有输出节点概率和为1（归一化）

交叉熵损失

损失公式

误差反向传播（链式求导）

权重的更新

在实际应用中往往不可能一次性将所有数据载入内存（算力也不够），所以只能分批次（batch）训练。

ps：ImageNet项目是一个用于视觉对象识别软件研究的大型可视化数据库。超过1400万的图像被ImageNet手动注释，以指示图片中的对象。

若使用整个样本集进行求解损失梯度指向全局最优方向
若使用分批次样本进行求解，损失梯度指向当前批次最优方向，训练过程更不平稳

优化器（optimazer）

作用：使网络得到更快的收敛

SDG优化器（Stochastic Gradient Descent）

缺点：易受样本噪声影响（有些数据标注错误），可能陷入局部最优解（按batch分批次）

SGD+Momentum优化器

Adagrad优化器（自适应学习率）

St是不断累计的损失梯度的平方和，初始化为0

RMSProp优化器（自适应学习率）

Adam优化器（自适应学习率）

几个优化器的比较

几个优化器的比较

Adam效果比较好，一些论文里面常用的还是SGD，根据具体情况选择

http://www.kler.cn/a/591824.html

相关文章：

python实现接口自动化

Paper Reading: AnomalyGPT：利用大型视觉-语言模型检测工业异常 (AAAI 2024 Oral)

20. Excel 自动化：Excel 对象模型

Springboot中的@ConditionalOnBean注解：使用指南与最佳实践

4.2 Reactive 对象的深度类型约束方案

linux 命令 cp

Pycharm接入DeepSeek，提升自动化脚本的写作效率

基于YOLOv8深度学习的PCB缺陷检测识别系统【python源码+GUI界面+数据集+训练代码】

C# BindingFlags 使用详解

在linux 系统下的qt 安装mqtt库

maven在idea上搭建

flutter 专题九十八 Flutter 1.7正式版发布

WPF 开发从入门到进阶（五）

JAVA EE(9)——线程安全——锁策略CAS

【安全运营】用户与实体行为分析（UEBA）浅析

Lua语言的自动化测试

【python】带有\n的json字符串，如何优雅打印

goweb中文件上传和文件下载

监控视频联网平台在智慧水利中的应用

技术革命、需求升级与商业生态迭代——基于开源AI大模型与智能商业范式的创新研究