当前位置：首页 > article >正文

CNN-day7-经典神经网络VGG

article 2025/2/9 8:32:49

day8-经典神经网络VGG

VGG的亮点在于它通过堆叠多个卷积层，以小的卷积核和池化层的方式来增加网络深度，从而实现高精度的图像识别。这种方法可以有效地捕获图像中的高级特征，并通过不断拟合训练数据来提高识别准确率。

1 小卷积作用

某层feature map上的元素看到前面不同层上的区域范围是不同的，通常在不特殊指定的情况下，感受野指的是看到输入图像上的区域。

网络层数增加（非线性表达能力增加）
网络参数数量减少

2 VGG版本

#configure
cfgs = {
    "A": [64, "M", 128, "M", 256, 256, "M", 512, 512, "M", 512, 512, "M"],#VGG11
    "B": [64, 64, "M", 128, 128, "M", 256, 256, "M", 512, 512, "M", 512, 512, "M"],#VGG13
    "D": [64, 64, "M", 128, 128, "M", 256, 256, 256, "M", 512, 512, 512, "M", 512, 512, 512, "M"],#VGG16,一般使用这个
    "E": [64, 64, "M", 128, 128, "M", 256, 256, 256, 256, "M", 512, 512, 512, 512, "M", 512, 512, 512, 512, "M"],#VGG19
}

self.classifier = nn.Sequential(
            nn.Linear(512 * 7 * 7, 4096),
            nn.ReLU(True),
            nn.Dropout(p=dropout),
            nn.Linear(4096, 4096),
            nn.ReLU(True),
            nn.Dropout(p=dropout),
            nn.Linear(4096, num_classes),
        )

3 存在的问题

1.网络架构非常大，需要大量的计算资源来训练。如要在较小设备上使用VGG会发现它非常慢并且可能无法获得足够的性能

2.网络结构非常深，可能会导致梯度消失或梯度爆炸。（在非常深的神经网络中，梯度在传播过程中可能会变得非常小或者非常大，导致模型无法正常训练）

4 VGG网络测试

将全连接替换为卷积，从而适应不同输入大小的图。

第1个全连接层转换为7×7的卷积层
后两个全连接层转换为1×1的卷积层
得到一个空间维度可变的多通道的概率图(class score map)，空间维度求和平均作为预测概率

5 VGG总体特征

与AlexNet同为链式结构，而且更加简单

结构非常简洁，整个网络使用了同样大小的卷积核尺寸（3×3）和最大池化尺寸（2×2）
几个小滤波器（3×3）卷积层的组合比一个大滤波器（5×5或7×7）卷积层好
层数更深更宽（11层、13层、16层、19层）
池化核变小且为偶数
验证了通过不断加深网络结构可以提升性能

http://www.kler.cn/a/537604.html

相关文章：

文件上传到腾讯云存储、签名及设置过期时间

k8s的操作指令和yaml文件

dijkstra算法类型题解

ASP.NET Core对JWT的封装

在rtthread中，scons构建时，它是怎么知道是从rtconfig.h找宏定义,而不是从其他头文件找？

【服务器知识】如何在linux系统上搭建一个nfs

鸿蒙harmony 手势密码

MHTML文件如何在前端页面展示

天润融通智能扩写工具如何让AI客服机器人更高效？

【大数据技术】搭建完全分布式高可用大数据集群（ZooKeeper）

ip转换相关知识详解

ximalaya（三） playUriList值解密--webpack

基于html写一个音乐动态爱心盒子有音乐和导航基本功能实现

webpack配置之---output.chunkFilename

Effective Python：（12）

sqli-labs靶场实录(二): Advanced Injections

适用于 Windows 的 Zed 编辑器的非官方稳定版。通过 scoop 或 pwsh 脚本轻松安装。不隶属于 Zed Industries

FPGA的IP核接口引脚含义-快解

kamailio的路由模块由lua脚本实现

如何将3DMAX中的3D文件转换为AutoCAD中的2D图形？

后端java工程师经验之谈，工作7年，mysql使用心得

java Jvm 双亲委派模型

【Ubuntu】本地部署Deep Seek(深度求索)大模型的保姆级教程 | 详细教程

ubuntu文件同步

MyCAT 2实现mysql8主从同步读写分离

通讯录管理小程序