当前位置: 首页 > article >正文

SPIRE: Semantic Prompt-Driven Image Restoration 论文阅读笔记

在这里插入图片描述

  • 这是一篇港科大学生在google research 实习期间发在ECCV2024的语义引导生成式修复的文章,港科大陈启峰也挂了名字。从首页图看效果确实很惊艳,尤其是第三行能用文本调控修复结果牌上的字。不过看起来更倾向于生成,对原图内容并不是很复原(不过在生成式方法中已经做得很好了),适合超级噪声图这种原图信息丢失十分严重的场景:
    在这里插入图片描述
  • 整体方法流程如下图所示,用的是stable diffusion的框架,甚至模型参数都是pretrain好后fix住的,在此之上,用controlnet的风格添加了另外一部分网络,来接收restoration的描述和degraded image,网络中的feature来调制这个train好的stable diffusion的unet中的feature,然后是可train的:
    在这里插入图片描述
  • 现在diffusion有了两个目标,一个是原有的stable diffusion在denoise的过程中还是文本梯度,另一个是最终生成的图片要和输入的LQ图片内容一致,而这部分梯度分开由需要train的那个网络承担。:
    在这里插入图片描述
  • 可以看到,这个方法的PSNR确实不高,但是视觉效果真的很好,泛化性感觉也不错:
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
  • 如果要一言以蔽之,这个工作可以说是controlnet的restoration 特供版,不过确实做得不错,可惜没看到有开源。

http://www.kler.cn/a/388979.html

相关文章:

  • C#发票识别、发票查验接口集成、电子发票(航空运输电子行程单)
  • Unity3D实现视频和模型融合效果
  • 设计模式:工厂方法模式和策略模式
  • 企业如何提高团队管理的能力?
  • 【贪心算法】——力扣763. 划分字母区间
  • 第16章 SELECT 底层执行原理
  • ThingsBoard规则链节点:Clear Alarm节点详解
  • Spark SQL大数据分析快速上手-DataFrame应用体验
  • jmeter常用配置元件介绍总结之用linux服务器压测
  • 如何让ffmpeg运行时从当前目录加载库,而不是从/lib64
  • React的概念以及发展前景如何?
  • 2024-2025第九届华为ICT大赛中国创新赛问题解答
  • 【Python】Pygame实战:实现基础跑酷游戏机(附源码)
  • Redis设计与实现 学习笔记 第十六章 Sentinel
  • 前端实现文件下载常用几种方式
  • 计算机课程管理:Spring Boot实现的工程认证解决方案
  • 中仕公考:2025年各地区公务员招考公告汇总
  • 【SpringBoot】18 上传文件到数据库(Thymeleaf + MySQL)
  • 关系数据的可视化——Python大数据可视化
  • Android 开启混淆R8编译问题处理
  • nVisual前端目录结构
  • [MySQL#14] 视图 | 用户管理 | 权限设置
  • RTOS IOT 结构
  • 速盾:游戏盾的功能和原理详解
  • 【HarmonyOS NEXT】一次开发多端部署(以轮播图、Tab栏、列表为例,配合栅格布局与媒体查询,进行 UI 的一多开发)
  • 【SQL】在 SQL Server 中创建数据源是 MySQL 数据表的视图