当前位置: 首页 > article >正文

inception_v3

目录

v3运作流程

通俗一点

Inception_v3 相较于 v2 的改进和优化

1. 分解大卷积核

2. 引入非对称卷积

3. 优化辅助分类器

4. 更高效的网络设计

5. 引入 Label Smoothing

v3网络结构


问题:Inception 系列网络在多角度提取特征的过程中,最终通过卷积层汇总不同程度的特征信息的运作流程是怎么样的?

Inception 系列网络的核心思想是通过 多尺度特征提取 来捕捉图像的不同层次的特征。具体来说,Inception 模块通过并行使用不同尺寸的卷积核(如 1x1、3x3、5x5)和池化操作,从多个角度提取特征,然后将这些特征在通道维度上进行拼接(concat),最终汇总成一个综合的特征表示。

从代码更好的看出来相当于多个特征进行拼接,多个特征图每个特征图其实也就包含多个通道(卷积核的数量)进行拼接就是组成一个更大的序列(网络的中间输出)

全局平均池化

v3运作流程
  1. 多尺度卷积
    1. Inception 模块中并行使用多种尺寸的卷积核:
      1. 1x1 卷积:捕捉局部特征(如边缘、颜色)。
      2. 3x3 卷积:捕捉中等范围的特征(如纹理、形状)。
      3. 5x5 卷积:捕捉更大范围的特征(如对象部分)。
      4. 池化操作(如最大池化):保留最显著的特征。
    2. 这些操作同时进行,分别提取不同尺度的特征。
  2. 特征融合
    1. 将不同尺度的卷积结果在 通道维度上 进行拼接(concat)
    2. 例如,假设 1x1 卷积输出 64 通道,3x3 卷积输出 128 通道,5x5 卷积输出 32 通道,池化输出 64 通道,那么拼接后的特征图通道数为 64+128+32+64=288
  3. 汇总特征信息
    1. 拼接后的特征图包含了从局部到全局的多层次信息。
    2. 这些特征信息会被传递到后续的 Inception 模块或全连接层,用于最终的分类或检测任务。

通俗一点

想象一下,Inception 模块就像一个 多功能的侦探团队

  • 1x1 卷积:像是一个“细节专家”,专注于捕捉图像的局部细节(如边缘、颜色)。
  • 3x3 卷积:像是一个“区域侦探”,负责分析中等范围的特征(如形状、纹理)。
  • 5x5 卷积:像是一个“全局侦探”,负责捕捉更大范围的特征(如对象整体)。
  • 池化操作:像是一个“总结专家”,负责保留最显著的特征。

这些侦探各自独立工作,然后将他们的发现(特征)汇总到一起,形成一个全面的报告(多尺度特征融合)。最终,这个报告被送到“决策层”(全连接层),由它来判断图像属于哪一类。

Inception_v3 相较于 v2 的改进和优化

Inception_v3 在 Inception_v2 的基础上进一步优化了网络结构,主要改进包括:

1. 分解大卷积核
  • 改进点:将大的卷积核(如 5x5)分解为多个小的卷积核(如两个 3x3)。
  • 作用
    • 两个 3x3 卷积核的堆叠可以模拟一个 5x5 卷积核的感受野,但参数数量和计算量更少。
    • 增加了网络的非线性能力,因为每个卷积层后面都有激活函数。
  • 通俗解释
    • 就像用两个小筛子(3x3)代替一个大筛子(5x5),虽然筛子的层数增加了,但整体效率更高,筛出的东西(特征)也更精细。
2. 引入非对称卷积
  • 改进点:将 3x3 卷积分解为 3x1 和 1x3 卷积。
  • 作用
    • 非对称卷积进一步减少了参数数量和计算量。
    • 在保持感受野的同时,提取更丰富的特征。
  • 通俗解释
    • 就像用两个方向不同的筛子(3x1 和 1x3)代替一个方形筛子(3x3),既省力又能捕捉更多细节。
3. 优化辅助分类器
  • 改进点:在网络的中间层添加辅助分类器,并通过正则化技术(如 Dropout)减少过拟合。
  • 作用
    • 辅助分类器提供了额外的监督信号,帮助梯度更好地传播到浅层。
    • 通过正则化技术,进一步提高了模型的泛化能力。
  • 通俗解释
    • 就像在工厂的生产线上加入多个质检员,确保每个环节的质量,同时避免过度依赖某个环节。
4. 更高效的网络设计
  • 改进点:通过更精细的网络设计(如更深的网络、更多的 Inception 模块),提高了特征提取能力。以及一些横向扩展每个inception模块多加几条特征提取分支
  • 作用
    • 更深的网络可以提取更高级的特征。
    • 更多的 Inception 模块增加了网络的表达能力。
  • 通俗解释
    • 就像给侦探团队增加更多的专家,让他们能够更全面地分析问题。
5. 引入 Label Smoothing
  • 改进点:在损失函数中引入 Label Smoothing 技术。
  • 作用
    • 减少模型对训练数据的过拟合。
    • 提高模型的泛化能力。
  • 通俗解释
    • 就像给模型“打预防针”,让它不要过于自信,从而提高应对新情况的能力。

v3网络结构

浅层一点inception模块

深层inception(在全连接层的前2个)


http://www.kler.cn/a/521492.html

相关文章:

  • 基于Python的药物相互作用预测模型AI构建与优化(上.文字部分)
  • 步入响应式编程篇(三)之spring webFlux与R2DBC
  • 10.3 LangChain实战指南:解锁大模型应用的10大核心场景与架构设计
  • Java中的注解与反射:深入理解getAnnotation(Class<T> annotationClass)方法
  • Excel 技巧21 - Excel中整理美化数据实例,Ctrl+T 超级表格(★★★)
  • JAVA实战开源项目:在线文档管理系统(Vue+SpringBoot) 附源码
  • 61.异步编程1 C#例子 WPF例子
  • 架构基础常识
  • Go 程序开发的注意事项
  • 安装 Prometheus、Grafana 和 Alertmanager
  • c++的容器和适配器究竟有什么差别?
  • 统计安卓手机一段时间内进程中每个线程的平均CPU使用率
  • mysql 学习6 DQL语句,对数据库中的表进行 查询 操作
  • http跳转https
  • Prism--对话服务
  • 如何使用DDD 的思想规划对应的模块
  • arcgis短整型变为长整型的处理方式
  • window保存好看的桌面壁纸
  • 一文讲解JVM中的G1垃圾收集器
  • 什么是vue.js组件开发,我们需要做哪些准备工作?
  • 洛谷题目: P2188 小Z的 k 紧凑数 (本题较难,省选-难度)题解
  • 深度学习:基于MindNLP的RAG应用开发
  • Python Typing: 实战应用指南
  • 安装Office自定义项,安装期间出错
  • 力扣算法题——11.盛最多水的容器
  • Synology 群辉NAS安装(5)介绍一下NAS的体系和安装container manager