当前位置: 首页 > article >正文

深度学习笔记数学方面——矩阵计算,自动求导

坚持每天打卡学习深度学习,今天学了数学部分。

1.列向量的导数是横向量

2 分子布局符号

分母布局符号对于分子布局和分母布局的结果来说,两者相差一个转置。

3.一些求导公式,加粗为向量

4.自动求导,计算一个函数在指定值上的导数,有别于符号求导,数值求导(高数中的)

5.计算图:将代码分解为操作子,将代码表示为一个无环图。

构造方式:显式构造,用于数学(Tensorflow,MXNet,Theano)

隐式构造(MXNet,PyTorch)

6.   y.backward()在PyTorch中是求导

7.PyTorch 是一种用于构建深度学习模型的功能完备框架,是一种通常用于图像识别和语言处理等应用程序的机器学习。使用 Python 编写,因此对于大多数机器学习开发者而言,学习和使用起来相对简单。PyTorch 的独特之处在于,它完全支持 GPU,并且使用反向模式自动微分技术,因此可以动态修改计算图形。这使其成为快速实验和原型设计的常用选择。

8.深度学习中,我们的目的不是计算微分矩阵, 而是批量中每个样本单独计算的偏导数之和

9.梯度是一个向量,是一个n元函数f关于n个变量的偏导数,梯度会指向各点处的函数值降低的方向。更严格的讲,梯度指示的方向是各点处的函数值减少最多的方向。因为方向导数=cos(\theta)×梯度,而\theta是方向导数的方向和梯度方向的夹角。所以,所有的下降方向中,梯度方向下降的最多。深度学习中, 神经网络的主要任务是在学习时找到最优的参数(权重和偏置),这个最优参数也就是损失函数最小时的参数。但是,一般情况下,损失函数比较复杂,参数也很多,无法确定在哪里取得最小值。所以通过梯度来寻找最小值(或者尽可能小的值)的方法就是梯度法。

10MXNet 是开源深度学习框架,允许用户在多种设备(无论是云基础设施还是移动设备)上定义、训练和部署深度神经网络。该框架具备高度可扩展性,可以进行快速的模型训练,并支持灵活的编程模型和多种语言。

利用 MXNet 可以混合符号和命令式编程,以更大限度提升效率和生产力。该框架的核心是动态依赖性调度程序,可自动即时并行处理符号式操作和命令式操作 图形优化层使符号执行速度更快、内存效率更高。

MXNet 库可移植并且规模小巧。它采用 NVIDIA Pascal™ GPU 加速,可以跨多个 GPU 和多个节点进行扩展,从而更快地训练模型。


http://www.kler.cn/a/563769.html

相关文章:

  • Linux关机重启和登录注销
  • C语言实现单链表
  • 线性回归(一)基于Scikit-Learn的简单线性回归
  • 记录Liunx安装Jenkins时的Package ‘jenkins‘ has no installation candidate
  • Jquery详解
  • FasterRCNN训练自己的数据集方法记录
  • 【SQL】客户报价/供应商料件价格分量计价函数
  • 关于网络端口探测:TCP端口和UDP端口探测区别
  • 【问题解决方案】随笔 - vscode里面出现双环境解决方案
  • 【REST2SQL】15银河麒麟系统下达梦数据库部署REST2SQL
  • Kubernetes与Docker:区别与优劣总结
  • 【构建工具】Gradle 8中Android BuildConfig的变化与开启方法
  • Nginx面试宝典【刷题系列】
  • Python----数据分析(Numpy一:numpy库简介,与list列表的区别,数组的创建,随机数组的创建)
  • 从零到一:如何用阿里云百炼和火山引擎搭建专属 AI 助手(DeepSeek)?
  • 支持selenium的chrome driver更新到133.0.6943.126
  • AIGC生图技术剖析:文本生成图像的核心算法与创新应用
  • 音频模拟信号转数字信号的原理
  • 基于Elasticsearch的日志管理:提升运维效率的新利器
  • 2025年2月科技趋势深度解析:大模型竞赛、硬件革命与可持续AI的未来