当前位置：首页 > article >正文

CVPR2023新作：基于组合空时位移的视频修复

article 2025/2/22 16:35:52

Title: A Simple Baseline for Video Restoration With Grouped Spatial-Temporal Shift (视频修复的简单基准：组合空时位移)
Affiliation: CUHK MMLab (香港中文大学多媒体实验室)
Authors: Dasong Li, Xiaoyu Shi, Yi Zhang, Ka Chun Cheung, Simon See, Xiaogang Wang, Hongwei Qin, Hongsheng Li
Keywords: video restoration, inter-frame information, deep learning, spatial-temporal shift, effective receptive field
Summary:

(1): 该文章研究视频修复，
(2): 过去的方法通常依赖于复杂的网络架构，例如：光流估计，可变形卷积和跨帧自注意力，这些方法会带来高额的计算成本。而本文提出的轻量级框架——基于组合空时位移的方法，能够隐含地捕捉多帧间的对应关系，并且可以扩展有效的感受野，同时使用基本的二维卷积聚合不同帧间的信息，相对于之前的方法可节约75%的计算成本。
(3): 该算法的核心是组合空时位移块，可以有效地实现大尺度的有效感受野。
(4): 在视频去模糊和视频降噪两个任务上，该方法均表现优于之前的最先进方法，证明了该方法可以在保持高质量结果的同时大大减少计算开销。

Methods:

(1): 本文提出了一种轻量级的视频修复框架，利用组合空时位移块来捕捉多帧间的对应关系，并扩展有效感受野。其中，组合空时位移块通过局部位移和空间注意机制对输入进行建模，并通过平均池化和最大池化来聚合特征，并利用反卷积恢复图像细节。
(2): 该算法分为两个关键步骤：(i) 异质帧间信息聚合；(ii) 异质帧间信息修改。其中，第一步采用组合空时位移块实现，可以有效地扩展有效感受野；第二步则通过反卷积层实现。
(3): 文中提到，该方法可以节省75%的计算成本。实验结果表明，该算法在视频去模糊和视频降噪两个任务上均优于之前的最先进方法，证明了该方法的有效性和实用性。

Conclusion:

(1): 本文提出了一种简单而有效的视频修复框架。通过引入轻量级的组合空时位移块，该方法可以隐含地捕捉多帧间的对应关系，同时扩展有效的感受野，大大减少计算成本。该方法在视频去模糊和降噪任务上具有更好的表现。
(2): 创新点：通过组合空时位移块实现了多帧间对应关系的建模，扩展了有效感受野，优化了计算成本。性能：在视频去模糊和降噪任务上表现优于之前最先进的方法。工作负荷：可以节省75%的计算成本。

http://www.kler.cn/a/107756.html

相关文章：

Tensorflow2 中模型训练标签顺序和预测结果标签顺序不一致问题解决办法

Jmeter调用Python脚本实现参数互相传递的实现

leetcode做题笔记204. 计数质数

Day13力扣打卡

java 读取pdf文件内容

2023年香水行业数据分析：国人用香需求升级，高端香水高速增长

【神印王座】易军献身为林鑫挡箭，万万没想到林鑫太坑，大跌眼镜

LLM在text2sql上的应用 | 京东云技术团队

Elasticsearch：使用 Open AI 和 Langchain 的 RAG - Retrieval Augmented Generation （四）

听GPT 讲Rust源代码--library/std(7)

docker与宿主机共享内存通信

css正确的语法

微服务-Feign

决定放弃uniapp开发了，因为它实在是没有taro友好

银河麒麟v10x86或者arm离线安装服务

【Python入门教程】基于OpenCV视频分解成图片+图片组合成视频（视频抽帧组帧）

CentOS 使用线程库Pthread 库

美颜SDK集成指南：为应用添加视频美颜功能

Kubernetes(K8s)从入门到精通系列之十八：使用 Operator Lifecycle Manager（OLM）安装operator

设计模式之桥梁模式