当前位置: 首页 > article >正文

020:为什么 Resnet 如此重要?

本文为合集收录,欢迎查看合集/专栏链接进行全部合集的系统学习。

合集完整版请查看这里。

Resnet 模型的重要性,上一节大概介绍了一下。

可以从以下两个方面来有所体现:

第一是 Resnet 广泛的作为其他神经网络的 back bone;

第二是 Resnet 是AI芯片厂家对标性能时,在视觉领域尤其是图像分类任务中的首选网络。

下面针对这两点再补充介绍一下。

哪些网络以 Resnet 作为 back bone?

back bone 意为骨干网络,很多模型将 resnet 作为骨干网络时,主要是因为需要从图像中提取高级特征的需要,也就是这些模型将 resnet 作为一个高效的特征提取器来使用。

Yolo-v3

在这里插入图片描述

YOLO (You Only Look Once) 网络是一个广泛应用的目标检测模型,上图是yolov3 的主要结构(图源江大白)。

最左上角红色框出来的便是 yolov3 的back bone, 由一些 resnet 结构串联而成。它的作用便是对原始输入的图像(最左侧)进行特征提取。

在yolov3模型中,通过在不同的 resnet 后拉出一个新的分支,来处理不同尺度下的图像特征,从而可以检测出图像中大尺寸的物体、小尺寸的物体、中尺寸的物体,如下图所示。
在这里插入图片描述

yolo 模型与 resnet 相比,还多了一些其他的网络结构,比如上下采样和 concat(这是一种联接操作),这是为了更好的完成图像的目标检测任务而设计的。

当我们将 resnet 这一部分的原理搞清楚之后,几乎可以无缝衔接的学习 yolo, 并且可以到很快学会。

特斯拉的占用网络

在这里插入图片描述

上图是特斯拉占用网络的结构图。

最上面一排的图片可以看作汽车摄像头采集到的图片,图片经过以 Resnet 为 BackBone 的特征提取器(Extractor)之后,再经过基于 transformer 结构的多传感器特征融合层(Multicam Fusion),随后再经过视频处理模块,便可以完成一些复杂的任务,比如物体的检测、物体的3D重建等。

当然除了yolo 和占用网络之外,还有很多网络也会用到 resnet,这里不一一列举了,感兴趣的小伙伴可以去搜索一下。

性能标杆

除了将 resnet 这一结构当做骨干网络之外,另一个让我觉得 resnet 很重要的地方在于,几乎所有的 AI 芯片公司,包括国外的英伟达,在测试自家芯片的时候,都会将 resnet50 的性能数据作为宣传, 如下是英伟达官网宣传自家GPU时的截图。

在这里插入图片描述

而后来成立的性能打榜平台 MLperf 中,更是将 resnet 的跑分数据作为了计算机视觉中一个重要的单项测试指标。
在这里插入图片描述

总之,经典且重要的 resnet50 神经网络模型,作为入门计算机视觉算法非常合适。

包含哪些算法呢?

这里汇总一下 resnet50 模型中包含的所有算法,并做简单介绍。

Resnet50 模型总共包含:卷积、激活函数、最大池化、加法、全局平均池化、全连接和 softmax 等几种算法。

卷积

卷积算法是卷积神经网络的核心。

它的主要作用是对图片(神经网络的第一层的输入是原始的图片)或者特征图(中间层卷积的输入是上一层卷积输出的特征图)进行特征提取,从而实现在不同尺度下的特征融合。

激活函数(Relu)

神经网络中的激活函数有很多,激活函数一般都跟在卷积层后面,用来对卷积的运算结果施加一个非线性变换的因素。

这是因为卷积算法的核心步骤是乘法和加法,而乘法和加法在数学中是一种线性变换。再多的乘法和加法融合起来最终还是线性的。

也就是说,如果一个卷积层后面紧跟着另一个卷积,那么两个卷积的作用和一个卷积实现的作用是类似的。

为了将两个卷积区分开,需要在卷积后面添加一个具有非线性特性的算法,使两个卷积连接起来并不能等价于一个卷积。

激活函数的另一个重要作用就是完成卷积输出的激活,将部分神经元激活,将部分神经元关闭。

最大池化和全局平均池化

池化层的作用是为了减少运算量,同时保留特征图中的关键特征。

加法

如上节介绍的那样,残差结构是增加了一个高速公路,最终的输出结果是F(x) + x, 这里的加法就是完成残差结构的输出 F(X) 和原始输入 X 的相加。

全连接

在 resnet50 神经网络的最后,还有一个全连接层。

很多模型或文章中也会称其为 Linear 层(线性层)或者FC层。它的作用是将神经网络学到的特征进一步融合,并且将特征映射到样本空间。也就是说,全连接的输出几乎可以与样本一一对应上。

在全连接的后面,有时还会跟有一个 softmax 层,用来完成一个多分类概率的输出。

softmax 并不改变全连接层输出的结果的相对大小,但是会让输出结果大的更大,小的更小,使得输出结果的top1或top5(最有可能的1个分类或者最有可能的前5个分类)更加明显。

好了,关于 Resnet 的介绍就到这里,接下来我们将重点拆解里面的各个算法将其原理,希望你跟上学习的步伐。


http://www.kler.cn/a/511337.html

相关文章:

  • 使用docker部署mysql和tomcat服务器发现的问题整理
  • 循环队列(C语言)
  • 《在ArkTS中实现模型的可视化调试和监控:探索与实践》
  • 【Android】蓝牙电话HFP连接源码分析
  • 【Linux 重装】Ubuntu 启动盘 U盘无法被识别,如何处理?
  • 【C++】面试题整理(未完待续)
  • K8S 容器重启策略
  • C#中如何使用异步编程
  • Mysql--实战篇--@Transactional失效场景及避免策略(@Transactional实现原理,失效场景,内部调用问题等)
  • 深度学习 DAY1:RNN 神经网络及其变体网络(LSTM、GRU)
  • Spring AI入门示例HelloWorld
  • 基于微信小程序的购物系统设计与实现(LW+源码+讲解)
  • 【江西新能源科技职业学院主办 | JPCS(ISSN: 1742-6588)出版,快速见刊检索】2025年可再生能源与节能国际会议(REEC 2025)
  • Windows中安装RabbitMQ
  • TrueNas Webui页面自定义
  • 2024年度总结:从后端Java到全栈成长的蜕变
  • python3GUI--仿崩坏三二次元登录页面(附下载地址) By:PyQt5
  • 如何优化前端性能,减少页面加载时间?
  • 解决 IntelliJ IDEA 项目包后出现“% classes”和“% lines covered”的问题
  • 在 Ubuntu 上安装 Nginx 的详细指南
  • 智能阅读时代:基于NLP的自动新闻摘要技术解析
  • 【VRChat · 改模】Unity工程导入人物模型;并添加着色器教程;
  • 简述mysql 主从复制原理及其工作过程,配置一主两从并验证
  • 论文阅读(一):下一代基因组学和遗传学的概率图模型
  • 简述mysql 主从复制原理及其工作过程,配置一主两从并验证。
  • 利用免费GIS工具箱实现高斯泼溅切片,将 PLY 格式转换为 3dtiles