【漫话机器学习系列】022.微积分中的链式求导法则(chain rule of Calculus)
链式求导法则(Chain Rule of Calculus)
链式求导法则是微积分中的重要工具,用于处理复合函数的求导。它描述了如何计算一个函数的函数(复合函数)的导数。
1. 链式法则的定义
假设有一个复合函数 y = f(g(x)),其中:
- 外层函数为 f(u),变量 u = g(x) 是内层函数。
链式求导法则表述为:
2. 直观理解
链式法则的核心思想是将复合函数的变化率分解为:
- 外层函数对内层函数的变化率(即 f'(u),
- 内层函数对自变量的变化率(即 g'(x))。
两者的乘积就是复合函数的整体变化率。
3. 数学推导
设 y = f(u) 且 u = g(x),则
其中:
- :外层函数的导数。
- :内层函数的导数。
因此,
4. 示例
示例 1:简单复合函数
已知 ,求导。
解:
- 令内层函数 ,则 。
- 内层导数:。
- 外层导数:。
- 复合导数:
示例 2:自然对数函数
已知 ,求导。
解:
- 外层函数:,导数为 。
- 内层函数:,导数为 。
- 根据链式法则:
示例 3:三角函数
已知 ,求导。
解:
- 外层函数:,导数为 。
- 内层函数:,导数为 。
- 根据链式法则:
5. 多层复合函数
链式法则可以扩展到多层复合函数。
示例:多层复合函数
已知 ,求导。
解:
- 最内层函数:,。
- 第二层函数:,。
- 最外层函数:,。
- 逐步求导并合并:
6. 实际应用
-
机器学习:
- 反向传播算法中,链式法则被用来计算神经网络的梯度。
- 例如,损失函数对参数的梯度是通过层层求导实现的。
-
物理学:
- 计算复杂系统的变化率,例如多变量变化的传播速度。
-
经济学:
- 分析复合函数关系中的边际效应,例如价格对需求的间接影响。
7. 总结
链式法则是微分学的核心工具,用于处理复合函数的求导问题。它将复杂的导数问题分解为简单的步骤,是解析、优化和计算的重要基础。