当前位置：首页 > article >正文

Deformable DETR中的look forword once

article 2024/12/23 12:39:41

在DINO中正对Deformable DETR中的look forward once做了改进

左图是Deformable DETR，右图是DINO

Look Forward Once对应的代码部分：

怎么理解iterative box refinement 可以阻止梯度反向传播来稳定训练？

reference_points = new_reference_points.detach()

什么是梯度切断？ 切断梯度表示阻止反向传播的梯度从当前层的 reference_points 传播到上一层。也就是说，后续层的梯度不会影响前一层生成的边界框参考点。
实现效果： 每一层的 reference_points 是通过当前层的预测生成的，但它不会受到后续层优化路径的影响，从而确保预测的独立性。

代码解析

1. DeformableTransformerDecoder中的self.box_embed不是赋值为None吗？在哪儿改变的值？

解答：

self.bbox_embed 被克隆为多个独立的实例，每个解码器层对应一个独立的 bbox_embed 模块。
然后，self.bbox_embed 被赋值到 self.transformer.decoder.bbox_embed。
这一赋值操作是外部对 DeformableTransformerDecoder.bbox_embed 的修改。

http://www.kler.cn/a/447902.html

相关文章：

ECharts柱状图-柱图42，附视频讲解与代码下载

数据结构经典算法总复习（下卷）

摩尔信使MThings的逻辑控制功能范例

ROS1入门教程3：自定义消息

LeetCode题练习与总结：预测赢家--486

JVM简介—1.Java内存区域

排序算法进一步总结

使用 AI 辅助开发一个开源 IP 信息查询工具：一

thinkphp 多选框

＜ Chrome Extension : TamperMonkey ＞去禁用网页的鼠标的事件（水文）

Pytorch | 利用MI-FGSM针对CIFAR10上的ResNet分类器进行对抗攻击

浅析InnoDB引擎架构（已完结）

Leetcode 37 Sudoku Solver

FastJSON 默认不会包含值为 null 的字段

C 语言实现四旋翼飞行器姿态控制：基于 PID 控制器(2)

【前端js】 indexedDB Nosql的使用方法

Sourcegraph 概述

Redis篇--常见问题篇8--缓存一致性3（注解式缓存Spring Cache）

opencv项目--文档扫描

3.metagpt中的软件公司智能体 (Architect 角色)

纯血鸿蒙APP实战开发——文字展开收起案例

C# cad启动自动加载启动插件、类库编译多个dll合并为一个

图解HTTP-HTTP协议

反归一化 from sklearn.preprocessing import MinMaxScaler

2024年最新多目标优化算法：多目标麋鹿群优化算法（MOEHO）求解DTLZ1-DTLZ7及工程应用---盘式制动器设计，提供完整MATLAB代码

iframe和浏览器页签切换