当前位置: 首页 > article >正文

改进YOLOv8 | 主干网络篇 | YOLOv8 更换骨干网络之 SwinTransformer | 《基于位移窗口的层次化视觉变换器》

在这里插入图片描述


论文地址:https://arxiv.org/pdf/2103.14030.pdf
代码地址:https://github.com/microsoft/Swin-Transformer

本文介绍了一种新的视觉Transformer,称为Swin Transformer,它可以作为计算机视觉通用的骨干网络。从语言到视觉的转换中,适应Transformer所面临的挑战源于两个领域之间的差异,如视觉实体尺度的巨大变化和图像中像素的高分辨率与文本中单词的差异。为了解决这些差异,我们提出了一种分层Transformer,其表示是通过Shifted窗口计算的。Shifted窗口方案通过将自注意计算限制在非重叠的本地窗口内,同时允许跨窗口连接,从而提高了效率。这种分层架构具有在不同尺度下进行建模的灵活性,并且与图像大小的计算复杂度呈线性关系。这些特性使Swin Transformer与广泛的视觉任务兼容,包括图像分类(在ImageNet-1K上的87.3top-1准确率)和密集预测任务,如物体检测(在COCO测试中的58.7 b


http://www.kler.cn/a/14312.html

相关文章:

  • 计算机网络三:运输层
  • 【5天打卡】学习Lodash的第一天——初体验
  • NUMA详解
  • c# api接口管理
  • 项目管理中,管理者如何打造团队执行力?
  • 数据库管理-第七十期 自己?自己(20230425)
  • 5.3 牛顿-科茨公式
  • lwip - 链路层收发以太网数据帧
  • Linux内核源码分析-进程调度(二)-常用数据结构
  • P1042 [NOIP2003 普及组] 乒乓球
  • Go | 一分钟掌握Go | 2 - 集成开发工具
  • 科学防雷接地和雷电防护方案
  • 本地运行 minigpt-4
  • TCP FACK 与 RACK
  • 改进YOLOv8 | 即插即用篇 | YOLOv8 引入 RepVGG 重参数化模块 |《RepVGG:让VGG风格的卷积神经网络再次伟大》
  • Ansys Zemax | 设计抬头显示器时要使用哪些工具 – 第一部分
  • Adobe国际认证证书,深化设计师个人优势!
  • shell脚本备份postgres SQL数据库(同台服务器备份脚本)
  • 前端异步编程全套:xmlhttprequest > ajax > promise > async/await
  • 打造高效团队利器,掌握必备技能,揭秘完美工具箱——DevOps!