inception_v3
目录
v3运作流程
通俗一点
Inception_v3 相较于 v2 的改进和优化
1. 分解大卷积核
2. 引入非对称卷积
3. 优化辅助分类器
4. 更高效的网络设计
5. 引入 Label Smoothing
v3网络结构
问题:Inception 系列网络在多角度提取特征的过程中,最终通过卷积层汇总不同程度的特征信息的运作流程是怎么样的?
Inception 系列网络的核心思想是通过 多尺度特征提取 来捕捉图像的不同层次的特征。具体来说,Inception 模块通过并行使用不同尺寸的卷积核(如 1x1、3x3、5x5)和池化操作,从多个角度提取特征,然后将这些特征在通道维度上进行拼接(concat),最终汇总成一个综合的特征表示。
从代码上会更好的看出来:相当于多个特征图进行拼接,多个特征图中每个特征图其实也就包含了多个通道(卷积核的数量),进行拼接时就是组成一个更大的序列(网络的中间输出)
全局平均池化
v3运作流程
- 多尺度卷积:
- Inception 模块中并行使用多种尺寸的卷积核:
- 1x1 卷积:捕捉局部特征(如边缘、颜色)。
- 3x3 卷积:捕捉中等范围的特征(如纹理、形状)。
- 5x5 卷积:捕捉更大范围的特征(如对象部分)。
- 池化操作(如最大池化):保留最显著的特征。
- 这些操作同时进行,分别提取不同尺度的特征。
- Inception 模块中并行使用多种尺寸的卷积核:
- 特征融合:
- 将不同尺度的卷积结果在 通道维度上 进行拼接(concat)。
- 例如,假设 1x1 卷积输出 64 通道,3x3 卷积输出 128 通道,5x5 卷积输出 32 通道,池化输出 64 通道,那么拼接后的特征图通道数为 64+128+32+64=288。
- 汇总特征信息:
- 拼接后的特征图包含了从局部到全局的多层次信息。
- 这些特征信息会被传递到后续的 Inception 模块或全连接层,用于最终的分类或检测任务。
通俗一点
想象一下,Inception 模块就像一个 多功能的侦探团队:
- 1x1 卷积:像是一个“细节专家”,专注于捕捉图像的局部细节(如边缘、颜色)。
- 3x3 卷积:像是一个“区域侦探”,负责分析中等范围的特征(如形状、纹理)。
- 5x5 卷积:像是一个“全局侦探”,负责捕捉更大范围的特征(如对象整体)。
- 池化操作:像是一个“总结专家”,负责保留最显著的特征。
这些侦探各自独立工作,然后将他们的发现(特征)汇总到一起,形成一个全面的报告(多尺度特征融合)。最终,这个报告被送到“决策层”(全连接层),由它来判断图像属于哪一类。
Inception_v3 相较于 v2 的改进和优化
Inception_v3 在 Inception_v2 的基础上进一步优化了网络结构,主要改进包括:
1. 分解大卷积核
- 改进点:将大的卷积核(如 5x5)分解为多个小的卷积核(如两个 3x3)。
- 作用:
- 两个 3x3 卷积核的堆叠可以模拟一个 5x5 卷积核的感受野,但参数数量和计算量更少。
- 增加了网络的非线性能力,因为每个卷积层后面都有激活函数。
- 通俗解释:
- 就像用两个小筛子(3x3)代替一个大筛子(5x5),虽然筛子的层数增加了,但整体效率更高,筛出的东西(特征)也更精细。
2. 引入非对称卷积
- 改进点:将 3x3 卷积分解为 3x1 和 1x3 卷积。
- 作用:
- 非对称卷积进一步减少了参数数量和计算量。
- 在保持感受野的同时,提取更丰富的特征。
- 通俗解释:
- 就像用两个方向不同的筛子(3x1 和 1x3)代替一个方形筛子(3x3),既省力又能捕捉更多细节。
3. 优化辅助分类器
- 改进点:在网络的中间层添加辅助分类器,并通过正则化技术(如 Dropout)减少过拟合。
- 作用:
- 辅助分类器提供了额外的监督信号,帮助梯度更好地传播到浅层。
- 通过正则化技术,进一步提高了模型的泛化能力。
- 通俗解释:
- 就像在工厂的生产线上加入多个质检员,确保每个环节的质量,同时避免过度依赖某个环节。
4. 更高效的网络设计
- 改进点:通过更精细的网络设计(如更深的网络、更多的 Inception 模块),提高了特征提取能力。以及一些横向的扩展,在每个inception模块中多加了几条特征提取的分支。
- 作用:
- 更深的网络可以提取更高级的特征。
- 更多的 Inception 模块增加了网络的表达能力。
- 通俗解释:
- 就像给侦探团队增加更多的专家,让他们能够更全面地分析问题。
5. 引入 Label Smoothing
- 改进点:在损失函数中引入 Label Smoothing 技术。
- 作用:
- 减少模型对训练数据的过拟合。
- 提高模型的泛化能力。
- 通俗解释:
- 就像给模型“打预防针”,让它不要过于自信,从而提高应对新情况的能力。
v3网络结构
浅层一点的inception模块:
深层的inception(在全连接层的前2个)