当前位置：首页 > article >正文

微积分在神经网络中的本质

article 2025/4/2 17:57:18

calculus

在一个神经网络中我们通常将每一层的输出结果表示为： $a^{[l]}$

$[1]$

对应的计算记录为为：
$a^{[l]}：\textcolor{red}{第l层}\\ a_{[j]}：\textcolor{green}{第j个神经元}\\$
代价函数为：

其中y为实际值，

而对于 ${d{C_0}\over dw}$ 是求斜率，或者具体的解释是 $\textcolor{green}{w}$ 的数值变动对 $\textcolor{red}{C_0}$ 的影响：

根据链式法则：

具体计算过程：

所以 $\textcolor{green}{w}$ 的数值变动对 $\textcolor{red}{C_0}$ 的影响与：真实值与计算值的偏差、激活函数 $\sigma$ ,上一层的输出值有关

如果理解了上述的内容，其他的代价函数 $\nabla C$ 就只是换偏导对象即可：

比如，如果要计算 ${d{C_0}\over db}$ ，只需要替换一项即可：

同理，应用在BP中可以计算 $w^{L}_{jk}\textcolor{red}{;一条线的权值的影响}$ （其中jk分别代表 $L - 1$ 和 $L$ 层中的不同点）：

也可以计算 $a^{L-1}_{k}\textcolor{red}{;前一层的输出值的影响}$ ：

比较两个数组内容是否相同

【机器学习6】概率图模型

LinkWeChat V4.9.8 版本发布

HCIA-综合实验（三）

linux 邮箱配置

十、Linux运行级别

创芯科技USB_CAN【库文件】

Network（四）NAT实现方式与VRRP概述

SQL编写规范【干货】

MySQL进阶_9.事务基础知识

Redis哨兵模式(Docker)

抽象工厂模式-C++实现

kubernetes--Pod控制器详解

【Java并发编程六】多线程越界问题