当前位置: 首页 > article >正文

11、PyTorch中如何进行向量微分、矩阵微分与计算雅克比行列式

文章目录

  • 1. Jacobian matrix
  • 2. python 代码

1. Jacobian matrix

  • 计算
    f ( x ) = [ f 1 = x 1 2 + 2 x 2 f 2 = 3 x 1 + 4 x 2 2 ] , J = [ ∂ f 1 ∂ x 1 ∂ f 1 ∂ x 2 ∂ f 2 ∂ x 1 ∂ f 2 ∂ x 2 ] = [ 2 x 1 2 3 8 x 2 ] \begin{equation} f(x)=\begin{bmatrix} f_1=x_1^2+2x_2\\\\f_2=3x_1+4x_2^2\end{bmatrix}, J=\begin{bmatrix} \frac{\partial f_1}{\partial x_1}&\frac{\partial f_1}{\partial x_2}\\\\ \frac{\partial f_2}{\partial x_1}&\frac{\partial f_2}{\partial x_2} \end{bmatrix}=\begin{bmatrix} 2x_1&2\\\\3&8x_2\end{bmatrix} \end{equation} f(x)= f1=x12+2x2f2=3x1+4x22 ,J= x1f1x1f2x2f1x2f2 = 2x1328x2
  • 我们假设 x 1 = 1 , x 2 = 2 x_1=1,x_2=2 x1=1,x2=2,可得Jacobian matrix 表示如下:
    J = [ 2 x 1 2 3 8 x 2 ] = [ 2 2 3 16 ] \begin{equation} J=\begin{bmatrix} 2x_1&2\\\\3&8x_2\end{bmatrix}=\begin{bmatrix} 2&2\\\\3&16\end{bmatrix} \end{equation} J= 2x1328x2 = 23216
  • 因为fx为向量,所以在pytorch中一般是没有的,我们需要定义一个标量z
    z = [ 1 1 ] [ f 1 f 2 ] → ∂ z ∂ f = [ 1 1 ] \begin{equation} z=\begin{bmatrix}1&1\end{bmatrix}\begin{bmatrix}f_1\\\\f_2\end{bmatrix}\to \frac{\partial z}{\partial f}=\begin{bmatrix}1&1\end{bmatrix} \end{equation} z=[11] f1f2 fz=[11]
  • 根据链式法则:
    ∂ z ∂ f ⋅ ∂ f ∂ x = ∂ z ∂ x \begin{equation} \frac{\partial z}{\partial f} \cdot\frac{\partial f}{\partial x}= \frac{\partial z}{\partial x} \end{equation} fzxf=xz
  • 假设我们代入可得:
    ∂ z ∂ f ⋅ ∂ f ∂ x = [ 1 1 ] [ 2 2 3 16 ] = [ 5 18 ] \begin{equation} \frac{\partial z}{\partial f} \cdot\frac{\partial f}{\partial x}= \begin{bmatrix}1&1\end{bmatrix}\begin{bmatrix} 2&2\\\\3&16\end{bmatrix}=\begin{bmatrix}5&18\end{bmatrix} \end{equation} fzxf=[11] 23216 =[518]
  • 根据pytorch中的自动微分,我们可以得到
    ∂ z ∂ x = [ 5 18 ] \begin{equation} \frac{\partial z}{\partial x}=\begin{bmatrix}5&18\end{bmatrix} \end{equation} xz=[518]
  • 小结1:我们用自动微分,是无法像直接用jacobian函数样求解jacobian矩阵,而是因为引入[1,1]向量后,只能求得和值[5,18]
  • 小结2:想用反向传播求得jacobian矩阵,需要将fx中的每一项标量拆开求得,后再叠加在一起

2. python 代码

#!/usr/bin/env python
# -*- coding:utf-8 -*-
# @FileName  :JacobianTest.py
# @Time      :2024/11/25 19:28
# @Author    :Jason Zhang
import torch
from torch import nn
from torch.autograd.functional import jacobian


def funx(x):
    return torch.stack([
        x[0] ** 2 + 2 * x[1], 3 * x[0] + 4 * x[1] ** 2
    ])


if __name__ == "__main__":
    run_code = 0
    in_x = torch.tensor([1.0, 2.0], dtype=torch.float, requires_grad=True)
    y = funx(in_x)
    y.backward(torch.ones_like(y))
    my_jacobian = jacobian(funx, in_x)
    print(f"my_jacobian=\n{my_jacobian}")
    x_grad = in_x.grad
    in_x_ones = torch.ones_like(in_x)
    jacobian_x_grad = in_x_ones @ my_jacobian
    print(f"x_grad={x_grad}")
    print(f"jacobian_x_grad={jacobian_x_grad}")
my_jacobian=
tensor([[ 2.,  2.],
        [ 3., 16.]])
x_grad=tensor([ 5., 18.])
jacobian_x_grad=tensor([ 5., 18.])

http://www.kler.cn/a/415008.html

相关文章:

  • MySQL - 表的增删查改
  • 思科实现网络地址转换(NAT)和访问控制列表(ACL)和动态路由配置并且区分静态路由和动态路由配置。
  • Vue3 调用子组件的方法和变量
  • 重学 Android 自定义 View 系列(九):侧边字母选择器
  • c++设计模式模块与系统
  • 机器学习之RLHF(人类反馈强化学习)
  • 11.22Pytorch_自动微分
  • LeetCode 2290. Minimum Obstacle Removal to Reach Corner
  • vue3+ant design vue实现上传组件图片默认展示
  • 技能之发布自己的依赖到npm上
  • 生成二维码vue2
  • java全栈day10--后端Web基础(基础知识)之续集
  • 贵阳思普信息技术有限公司 OA系统 apilogin 接口存在SQL注入漏洞风险
  • 如何利用Java爬虫按关键字搜索工厂数据
  • JVM的内存区域划分
  • 【前端知识】SCSS(Sassy CSS)是一种CSS预处理器语言
  • 《Learn Three.js》学习(2)构建Three.js基本组件
  • 专业学习|如何绘制算法流程图?
  • 华为E9000刀箱(HWE9000V2)服务器硬件监控指标解读
  • http的文件上传和下载原理