当前位置: 首页 > article >正文

深度学习中的epoch, batch 和 iteration

名词定义
epoch使用训练集的全部数据进行一次完整的训练,称为“一代训练”
batch使用训练集中的一小部分样本对模型权重进行一次反向传播的参数更新,这样的一部分样本称为:“一批数据”
iteration使用一个batch的数据对模型进行一次参数更新的过程,称为“一次训练”

epoch:所有的训练样本都在神经网络中进行了一次正向传播和一次反向传播。然而,当一个epoch的样本数量可能过于庞大,就需要把它分成多个小块,也就是分成多个batch来进行训练。

batch(批,一批样本):将训练样本分成若干个batch

batch_size(批大小):每批样本的大小
iteration(一次迭代):训练一个Batch就是一次Iteration

换算关系:
N u m b e r o f B a t c h e s = T r a i n i n g S e t S i z e B a t c h S i z e Number of Batches = \dfrac{Training Set Size}{Batch Size} NumberofBatches=BatchSizeTrainingSetSize

实际上,梯度下降的几种方式的根本区别就在于上面公式中的Bathch_Size 不同,

梯度下降方式训练集大小batch_sizenumber of batchs
BGD(批量梯度下降)NN1
SGD(随机梯度下降)N1N
MBGD(小批量梯度下降)NBN/B+1

举个例子:

mnist 数据集有60000张图片作为训练数据,10000张图片作为测试数据。假设现在选择 ==Batch_Size =100 ==对模型进行训练。迭代30000次。

  • 每个 Epoch 要训练的图片数量:60000(训练集上的所有图像)
  • 训练集具有的 Batch 个数:600=60000/100
  • 每个 Epoch 需要完成的 Batch 个数:600
  • 每个 Epoch 具有的 Iteration 个数:600(完成一个- Batch训练,相当于参数迭代一次)
  • 每个 Epoch 中发生模型权重更新的次数:600
  • 训练 10 个Epoch后,模型权重更新的次数:6000=600*10
  • 不同Epoch的训练,其实用的是同一个训练集的数据。第1个Epoch和第10个Epoch虽然用的都是训练集的图片,但是对模型的- 权重更新值却是完全不同的。因为不同Epoch的模型处于代价函数空间上的不同位置,模型的训练代越靠后,越接近谷底,其代价越小。
  • 总共完成30000次迭代,相当于完成了30000/600=50 个 Epoch

http://www.kler.cn/news/108514.html

相关文章:

  • 搭建微信小程序环境及项目结构介绍
  • Unity之ShaderGraph如何实现科幻空气墙
  • java中Map常见的面试问题,扩容问题,转红黑树的前提,解决Hash哈希冲突的方法
  • React-表单受控绑定和获取Dom元素
  • 基于群居蜘蛛算法的无人机航迹规划
  • 系统架构设计师-第16章-嵌入式系统架构设计理论与实践-软考学习笔记
  • 负载均衡的综合部署练习(hproxy+keepalived和lvs-DR+keepalived+nginx+Tomcat)
  • 漏洞复现-jquery-picture-cut 任意文件上传_(CVE-2018-9208)
  • windows8080端口占用
  • 更新电脑显卡驱动的操作方法有哪些?
  • Mac电脑配置Dart编程环境
  • YUV的红蓝颠倒(反色)的原因及解决
  • 通过Vue自带服务器实现Ajax请求跨域(vue-cli)
  • 【数据分析】上市公司半年报数据分析
  • ListenableFuture和countdownlatch使用example
  • mac 安装homebrew ,golang
  • 基于单片机16位智能抢答器设计
  • 圆锥面积 题解
  • 汇总下之RobotFramework自动化框架的系列文章
  • 计网强化
  • RSA ——Rational Structure Architecture r入门教程
  • 360智慧生活旗舰产品率先接入“360智脑”能力实现升级
  • AI:40-基于深度学习的森林火灾识别
  • SparkStreaming【实例演示】
  • Kotlin协程核心理解
  • 计算机网络重点概念整理-第四章 网络层【期末复习|考研复习】
  • pytorch-fastrcnn识别王者荣耀敌方英雄血条
  • Linux中shell脚本练习
  • 【Python 高级特性】深入 NamedTuple 命名元组
  • 第四部分:JavaScript