当前位置: 首页 > article >正文

如何理解深度学习的训练过程

文章目录

      • 1.训练是干什么?
      • 2.预训练模型进行训练,主要更改的是预训练模型的什么东西?

1.训练是干什么?

以yolov5为例子,训练的目的是把一组输入猫狗图像放到神经网络中,得到一个输出模型,这个模型下次可以直接用来识别哪个是猫,哪个是狗

2.预训练模型进行训练,主要更改的是预训练模型的什么东西?

  • 超参数(Hyperparameters):

这是模型结构中定义的参数,比如:
卷积核大小(kernel_size):影响特征提取的精细程度。
步长(stride):决定卷积操作在输入特征图上的移动幅度,影响输出的特征图大小。
激活函数(如SiLU):影响非线性变换的方式。
层数、通道数(如卷积核数量、隐藏层数量):影响模型的复杂度。
调整这些超参数不涉及对模型本身权重的学习,而是你手动设计模型结构的过程。你可以手动设置这些参数,优化模型的表现。

  • 模型参数(Trainable Parameters):

这是模型在训练过程中通过数据自动学习的参数,主要是卷积层的权重和偏置。比如卷积核内部的权重(Conv2d中的weights和bias)会随着训练数据的输入和误差的反馈不断更新。
这些参数是在反向传播过程中由优化器(如Adam、SGD等)自动调整的,目的是使模型更好地拟合训练数据。(这里的weights和bias是隐含的,不会出现在打印出的网络结构中)


http://www.kler.cn/news/304711.html

相关文章:

  • B站宋红康JAVA基础视频教程(chapter14数据结构与集合源码)
  • 图文检索(1):Rethinking Benchmarks for Cross-modal Image-text Retrieval
  • DORIS - DORIS之倒排索引
  • 【实践】应用访问Redis突然超时怎么处理?
  • FastAPI 应用安全加固:HTTPSRedirectMiddleware 中间件全解析
  • OpenStack × OceanBase: 打造高可用可扩展的基础设施平台
  • ARM驱动学习之4小结
  • Docker高级管理--Compose容器编排与私有仓库(Docker技术集群与应用)
  • 使用Spring Boot集成Nacos进行配置管理
  • rocky8安装docker步骤
  • Apple Watch Series 10 動手玩:更大、更輕、更薄
  • 华为VRP系统基本操作
  • php 之 php-fpm 和 nginx结合使用
  • 使用Rustup快速无缝升级Rust
  • Mac快速复制和删除命令
  • Gitlab实现多项目触发式自动CICD
  • 时序预测 | Matlab实现GA-CNN遗传算法优化卷积神经网络时间序列预测
  • Java许可政策再变,Oracle JDK 17 免费期将结束!
  • 7.测试用例设计方法 + Bug
  • linux安全软件Hydra使用教程
  • 速盾:cdn节点越多越好吗?
  • 如何优雅的使用 Nacos
  • Go语言现代web开发11 函数
  • git子模块处理的一些方法
  • 2024年华为9月4日秋招笔试真题题解
  • WalkMe的数字用户体验到底是啥
  • APP广告变现流量售卖,选择API还是SDK对接?
  • 前端Excel热成像数据展示及插值算法
  • DAY 9 - 10 : 树
  • 海量智库第31期 | 自治事务原理与应用解析