当前位置: 首页 > article >正文

【图像分类】卷积神经网络之VGG网络模型结构详解

写在前面:
首先感谢兄弟们的关注和订阅,让我有创作的动力,在创作过程我会尽最大能力,保证作品的质量,如果有问题,可以私信我,让我们携手共进,共创辉煌。

1. 前言

VGG全称是Visual Geometry Group,因为是由Oxford的Visual Geometry Group提出的。

VGG网络是卷积神经网络中的一种,在 2014 的 ImageNet 竞赛中,获得了定位任务第一名和分类任务第二名的好成绩。总结起来就是它使用了更小的滤波器,同时使用了更深的结构,AlexNet只有8层网络,而VGG有16层–19层网络,也不像AlexNet网络使用11×11那么大的滤波器,它只使用3×3的滤波器和2×2的池化层。

它之所以使用很多小的滤波器,是因为层叠很多小的滤波器的感受野和一个大的滤波器的感受野是相同的,还能减少参数,同时有更深的网络结构。

VGG只是对网络层进行不断的堆叠,并没有进行太多的创新,而增加深度确实可以一定程度改善模型效果。

2. VGG网络

卷积网络的输入是224×224的RGB图像,整个网络的组成是非常格式化的,基本上都用的是3×3的卷积核以及 2×2的池化,少部分网络加入了1×1的卷积核。

解释两个关键问题:

  • 作者用的是多个3×3卷积叠加,而不是例如7×7、11×11的单个卷积,原因如下:

3个3×3卷积叠加得到的理论感受野和一个7×7卷积的理论感受野是相同的。


http://www.kler.cn/a/7667.html

相关文章:

  • git常用命令+搭vscode使用
  • Elastic Agent:可灵活地在任何地方发送和处理任何数据
  • 安全,服务器证书和SSL连接
  • 【知识科普】微内核架构与宏内核架构
  • ElasticSearch-全文检索(一)基本介绍
  • Java垃圾回收算法
  • Atlassian Server用户新选择 | 迁移到数据中心版前,您需要做这些准备(2)
  • Java中String类型的创建关系、什么是常量池、以及StringBuilder/Buffer等
  • leetcode:验证回文串(详解)
  • 【音视频】zlmediakit总结二---webrtc编译
  • 【06】卷积
  • Spring Security 权限控制
  • mysql数据库简介
  • UE4 Sequence学习
  • 微软新Bing AI,带chat聊天写作等功能的搜索引擎简介
  • Nodejs+vue+elementui网上租车网站 vscode汽车租赁系统
  • 【MATLAB】一篇文章带你了解beatxbx工具箱使用
  • Zookeeper
  • Java多线程基础汇总(上)
  • 你写的C语言代码被翻译成可执行程序,需要这几步
  • 【ArcGIS Pro二次开发】(12):txt文件和Excel文件的读写
  • Java稀疏数组的应用
  • BERT: Pre-training of Deep Bidirectional Transformers forLanguage Understanding
  • 单例模式何以保证线程安全
  • Less 运行环境
  • ChatGPT能够干翻谷歌吗?