当前位置: 首页 > article >正文

(上)基于机器学习的图像识别——遥感图像分类(LeNet-5;AlexNet;VGGNet;GoogLeNet;ResNet)

遥感图像识别:

专业词汇:

kernel:卷积

目录

遥感图像分类 1.1 LeNet-5

视频来源:

任务:使用什么网络实现遥感图像的分类

LeNet-5结构:

遥感图像分类 1.2 AlexNet(冠军)

视频来源:

1主要i内容:

AlexNet结构:

遥感图像分类 1.3 VGGNet(亚军)

视频来源:

主要内容:

VGGNet结构:

遥感图像分类 1.4 GoogLeNet

视频来源:

GoogLeNet结构:

 遥感图像分类 1.5 ResNet

视频来源:

ResNet结构:


遥感图像分类 1.1 LeNet-5

视频来源:

遥感图像分类 1.1 LeNet-5_哔哩哔哩_bilibili

任务:使用什么网络实现遥感图像的分类

  •  基于MNIST的遥感数据集
  • LeNet-5搭建,训练,保存
  • LeNet-5调用和预测

LeNet-5结构:

基于MNIST的遥感数据集:

数据集放在了评论区,用来进行验证

从CSV文件中载入数据(数据采集):

  1. 读取CSV 文件
  2. 转换成数组
  3. 读取图片
  4. 读取标签
  5. 维度改变         4:05

总结:

  1. 数据采集  :
    按照列读取CSV 文件  标签信息  图片信息  维度处理  (和之前一样)
  2. 建立模型:
    和上节课一样
  3. 模型训练:
    增加轮数以达到更好的训练效果(max=80%)
  4. 模型测试:
    通过画图的方式,可视化正确率,遇到瓶颈
    对预测的位置信息转换成对应名称(通过数据方式实现)

遥感图像分类 1.2 AlexNet(冠军)

视频来源:

遥感图像分类 1.2 AlexNet_哔哩哔哩_bilibili

1主要i内容:

  1. 遥感图像的载入
  2. AlexNet结构与创新
  3. AlexNet搭建,训练,预测

AlexNet结构:

去网上找遥感图片

载入数据:

  1. 按照路径读取(相对路径)
  2. 预处理
    归一化——水平翻转4:04——批大小——随机——尺寸——独热编码
  3. 基础知识:
    步长 Stride & 加边 Padding &参数 Param
    卷积后尺寸=(输入图像大小-卷积核大小+加边像素数)/步长 +1
    Tensorflow默认:Padding='valid'(丢弃),strides=1
    设置:Padding=same':保证输出和输出尺寸不变,自动设置填充
    参数:
    卷积层:(卷积参数(卷积核各部分)+偏置参数)*卷积核的个数
    池化层:不需要训练参数
    全连接层:神经元连接权重+偏置参数

模型搭建:ReLU&Dropout

模型训练:learning_rate&batch_size


遥感图像分类 1.3 VGGNet(亚军)

视频来源:

遥感图像分类 1.3 VGGNet_哔哩哔哩_bilibili

主要内容:

  1. VGGNet 结构与创新
  2. VGGNet训练与预测
  3. 迁移学习训练VGGNet

VGGNet结构:

数据载入方式和上节课一样

感受视野 Receptive Field
定义:输出层一个元素对应输入层区域的大小。
计算:感受视野=(上一层感受视野-1)*步长 +卷积核尺寸
VGGNet提出:

堆叠两个3*3卷积核替代一个5*5卷积核
堆叠三个3*3卷积核替代一个7*7卷积核。
相同感受视野,训练参数量减少。

迁移学习:


遥感图像分类 1.4 GoogLeNet

视频来源:

遥感图像分类 1.4 GoogLeNet_哔哩哔哩_bilibili

  1.  GoogLeNet结构
  2. GoogLeNet创新
  3. GoogLeNet训练与预测

GoogLeNet结构:

Inception模块:

输入为28*28*192(*不考虑偏置项)
直接32个5X5                                                  卷积参数:5*5*192*32=105600
先使用16个1X1卷积降维,再使用32个5X5   卷积参数:1*1*192*16+5*5*16*32=15872

Padding问题:
TensorFlow中 padding= 'same'
输出图像的长和宽=输入图像/步长(结果向上取整)
*如果步长为1,卷积、池化操作不改变图像的长宽。

参考NIN网络:

使用全局平均化代替全连接层,避免全连接层带来的大量训练参数


遥感图像分类 1.5 ResNet

视频来源:

遥感图像分类 1.5 ResNet_哔哩哔哩_bilibili

ResNet结构:

  Batch Normalization 批量归一化:
每一层输入的时候,先做一个归一化处理,然后在进入网络的下一层
避免梯度消失和爆炸,训练更稳定

退化现象(不同于过拟合):
网络层数越多,训练集loss逐渐下降,之后趋于饱和,继续增加网络深度的话,训练集loss反而更大  

捷径分支:

模型搭建:

残差模块: 

最后附上本人粗浅的见解,感觉以上这五个网络结构可以看成处理(机器学习图像)/(遥感图像分类的五种(数学方法)/(函数方法


http://www.kler.cn/a/568215.html

相关文章:

  • 车载定位监控系统开发指南
  • 运维Splunk面试题及参考答案
  • 聚焦低空经济,峰飞航空飞行汽车开启未来出行新篇章
  • 「JVS更新日志」低代码、企业会议、智能BI、智能排产2.26更新说明
  • 一、Vscode、Git、Github账号及个人访问令牌
  • 使用mermaid查看cursor程序生成的流程图
  • WSL2下,向github进行push时出现timeout的问题
  • 8.5 kubelet维护pod的内存管理器podManager源码解析
  • 测试金蝶云的OpenAPI
  • 使用 Kubeflow 和 Ray 构建机器学习平台
  • 机器学习:监督学习、无监督学习和强化学习
  • 达梦数据库阻塞死锁及解锁
  • Excel工作圈小工具一个集合了大量Excel功能的绿色工具软件
  • C#中使用Newtonsoft.Json多态正反序列化
  • 基于 MetaGPT 自部署一个类似 MGX 的多智能体协作框架
  • 内容中台的企业CMS架构是什么?
  • 对话式AI引擎:DeepSeek技术引领多模态交互新篇章
  • RabbitMq延时队列的实现
  • 【漫话机器学习系列】107.线性组合(Linear Combination)
  • 【论文阅读笔记】SL-YOLO(2025/1/13) | 小目标检测 | HEPAN、C2fDCB轻量化模块