当前位置: 首页 > article >正文

Conditional GAN

Text-to-Image

对于根据文字生成图像的问题,传统的做法就是训练一个NN,然后输入一段文字,输出对应一个图片,输出图片与目标图片越接近越好。存在的问题就是,比如火车对应的图片有很多张,如果用传统的NN来训练,模型会产生多张图像的平均,结果就会很模糊。

Conditional GAN

Conditional GAN与普通GAN的区别在于输入加入了一个额外的condition,并且在训练的时候使得输出的结果拟合这个 condition。

此时的discriminator的输入是generator的输出和conditional vector,此时discriminator有两个任务:

  1. 判断图片质量的好坏(图片是否是真实图片)。
  2. 图片是否和输入条件匹配。

Algorithm

训练D(固定G):

  1. 首先从database中抽取m个样本,每个样本都是一对条件和图片。
  2. 从一个分布中抽取m个vector z;然后每个vector都加上条件,表示为(c,z)。
  3. 将(c,z)输入generator,生成m张图片x (条件+图片)。
  4. 从database中随机选取m个真实图片 x
  5. 计算损失,最大化损失。

训练G(固定D):

  1. 随机产生m个噪声,随机从database中抽取m个条件;
  2. 通过generator得到G(C,Z),然后经过discriminator得到D(G(C,Z)),更改G中的参数,使得它的得分越高越好。

具体设计条件GAN判别器,有两种方式:

  1. 图片x经过一个网络变成一个code,条件经过一个网络也变成一个code;把这两种code组合在一输入到网络里面,输出一个分数。
  2. 首先让图片经过一个网络,输出一个分数(用于判断图片是否真实),同时这个网络也输出一个code,这个code和条件结合起来输入到另外一个网络里,也输出一个分数(图片和文字是否匹配)。

Stack GAN(叠加生成对抗网络)

第一个网络生成小的图片,第二个网络生成大的图片。

  • Image-to-image

传统做法存在的问题就是产生的图片很模糊,是因为它是许多张图片的平均。

Conditional GAN的做法就是,generator的输入一张图片和noise z,输出一张图片,discriminator会输入产生的image和input,输出一个scalar。通过算法的迭代,生成下面第三张图片,看起来很清晰,但和真实的图片还是有差异。所以提出了GAN+close,对generator生成的image加上限制,使得生成的image与真实对象越接近越好,得到第四张图片。

  • Speech Enhancement(语音增强)

这里和image-to-image原理类似,都是把G的输入和输出作为D的输入。

  • Video Generation

   Video Generation能够根据影片的前几帧产生后几帧。conditional 为之前几帧的图片。

 

 


http://www.kler.cn/a/136432.html

相关文章:

  • 网络安全基础以及概念
  • 【Vim Masterclass 笔记09】S06L22:Vim 核心操作训练之 —— 文本的搜索、查找与替换操作(第一部分)
  • 12_Redis发布订阅
  • fast-crud select下拉框 实现多选功能及下拉框数据动态获取(通过接口获取)
  • 快速实现一个快递物流管理系统:实时更新与状态追踪
  • Linux 系统下磁盘相关指令:df、du、fdisk、lsblk
  • Python如何将项目直接打包为一键整合包
  • C语言--给定一行字符串,获取其中最长单词【图文详解】
  • 记GitLab服务器迁移后SSH访问无法生效的问题解决过程
  • NX二次开发UF_CAM_ask_lower_limit_plane_status 函数介绍
  • 【PyQt小知识 - 3】: QComboBox下拉框内容的设置和更新、默认值的设置、值和下标的获取
  • 【Kingbase FlySync】命令模式:安装部署同步软件,实现KES到KES实现同步
  • vscode设置前进、后退快捷键
  • 社会媒体营销提问常用的ChatGPT通用提示词模板
  • 什么时候用@MapperScan 注解?
  • uniapp开发小程序,包过大解决方案
  • 服务器数据恢复—OCFS2下raid5磁盘损坏导致阵列崩溃的数据恢复案例
  • 存储配置和挂载方式
  • esbuild打包
  • Ubuntu18.04运行gazebo的launch文件[model-4] process has died报错
  • BUUCTF [BJDCTF2020]鸡你太美 1
  • 米勒拉宾算法——素性测试
  • XCTF(攻防世界)---Web新手区题目WP
  • vscode 设置vue3 通用页面模板
  • WSL2安装ubuntu及修改安装位置,设置Ubuntu开机启动链接ssh服务
  • 京东小程序:无代码开发实现API集成,连接电商平台、CRM和客服系统