当前位置: 首页 > article >正文

深度学习之数据增强

1 深度学习中常用的数据增强方法?

  • Color Jittering:对颜色的数据增强:图像亮度、饱和度、对比度变化(此处对色彩抖动的理解不知是否得当);

  • PCA Jittering:首先按照RGB三个颜色通道计算均值和标准差,再在整个训练集上计算协方差矩阵,进行特征分解,得到特征向量和特征值,用来做PCA Jittering;

  • Random Scale:尺度变换;

  • Random Crop:采用随机图像差值方式,对图像进行裁剪、缩放;包括Scale Jittering方法(VGG及ResNet模型使用)或者尺度和长宽比增强变换;

  • Horizontal/Vertical Flip:水平/垂直翻转;

  • Shift:平移变换;

  • Rotation/Reflection:旋转/仿射变换;

  • Noise:高斯噪声、模糊处理;

  • Label Shuffle:类别不平衡数据的增广;

2 如何理解 Internal Covariate Shift?

​ 深度神经网络模型的训练为什么会很困难?其中一个重要的原因是,深度神经网络涉及到很多层的叠加,而每一层的参数更新会导致上层的输入数据分布发生变化,通过层层叠加,高层的输入分布变化会非常剧烈,这就使得高层需要不断去重新适应底层的参数更新。为了训好模型,我们需要非常谨慎地去设定学习率、初始化权重、以及尽可能细致的参数更新策略。

​ Google 将这一现象总结为 Internal Covariate Shift,简称 ICS。 什么是 ICS 呢?

​ 大家都知道在统计机器学习中的一个经典假设是“源空间(source domain)和目标空间(target domain)的数据分布(distribution)是一致的”。如果不一致,那么就出现了新的机器学习问题,如 transfer learning / domain adaptation 等。而 covariate shift 就是分布不一致假设之下的一个分支问题,它是指源空间和目标空间的条件概率是一致的,但是其边缘概率不同。

​ 大家细想便会发现,的确,对于神经网络的各层输出,由于它们经过了层内操作作用,其分布显然与各层对应的输入信号分布不同,而且差异会随着网络深度增大而增大,可是它们所能“指示”的样本标记(label)仍然是不变的,这便符合了covariate shift的定义。由于是对层间信号的分析,也即是“internal”的来由。

那么ICS会导致什么问题?

简而言之,每个神经元的输入数据不再是“独立同分布”。

其一,上层参数需要不断适应新的输入数据分布,降低学习速度。

其二,下层输入的变化可能趋向于变大或者变小,导致上层落入饱和区,使得学习过早停止。

其三,每层的更新都会影响到其它层,因此每层的参数更新策略需要尽可能的谨慎。


http://www.kler.cn/a/380444.html

相关文章:

  • 关于git命令
  • 【React】初学React
  • 【折腾一上午】Java POI 导出 Excel 自适应列宽行高
  • 使用JdbcTemplate 进行数据库的增、删、改、查
  • 缓存、注解、分页
  • 打包IPA包上传,报错“您的可执行文件包含不受支持的体系结构(×86 _64 i386)”
  • DDOS的攻击方式有哪些?
  • 音视频入门基础:H.264专题(22)——通过FFprobe显示H.264裸流每个packet的信息
  • 内网远程连接解决方案【Frp】
  • C# 程序暂停的两种方式
  • 11.4OpenCV_图像预处理02
  • LoRA(Low-Rank Adaptation)的工作机制 - 使用 LoRA 库来微调深度学习模型的基本步骤
  • 学习笔记:黑马程序员JavaWeb开发教程(2024.11.4)
  • 虚拟机 Ubuntu 扩容
  • Qt第三课 ----------输入类的控件属性
  • 深度学习之Dropout
  • K8S flannel网络模式对比
  • 恒创科技:如何知道一台服务器能承载多少用户?
  • 【Elasticsearch系列】更改 Elasticsearch 用户密码的详细指南
  • 【RAG多模态】多模态RAG-ColPali:使用视觉语言模型实现高效的文档检索
  • Python pyautogui库:自动化操作的强大工具
  • Redis-06 Redis面试高频问题、Redis日常开发规避问题
  • 【LLM-多模态】MM1:多模态大模型预训练的方法、分析与见解
  • mybatis 参数判断报错的问题
  • ML2001-2 机器学习/深度学习 过拟合(overfit)
  • Qt中的Model与View5: QStyledItemDelegate