当前位置：首页 > article >正文

GAN：WGAN-DIV

article 2025/4/2 17:41:00

论文：https://arxiv.org/pdf/1712.01026.pdf

代码：

发表：2018

摘要

在计算机视觉的许多领域中，生成对抗性网络已经取得了巨大的成功，其中WGANs系列被认为是最先进的，主要是由于其理论贡献和竞争的定性表现。然而，通过 Wasserstein-1 度量（W-met）来近似 k-Lipschitz约束是非常具有挑战性的。作者提出了一种新的 Wasserstein 散度（W-div），它是W-met的松弛版本，不需要k-Lipschitz约束。

公式

$z$ 是随机噪声

$x$ 是真数据

$\hat{x}$ 是真数据与假数据的线性混合

$k,p$ 是两个超参数

再对比一下wgan-gp与wgan-div的目标函数的差异

在 WGAN-gp 中，为了满足 1-Lipschitz 约束，训练出好效果，采用了真假数据的插值方法，来模拟全空间的均匀分布。 WGAN-div 的作者说，这种做法是一种机械性的，很难靠有限的采样，模拟出这种全空间分布。

with a finite number of training iterations on limited input samples, it is very difficult to guarantee the k-Lipschitz constraint for the whole input domain.

算法流程

超参选择-k,p

作者固定p = 6，测试不同的k，结果为右下角：发现 $L_{DIV}$ 变化不大。FID基本在16附近。

作者固定k = 2，测试不同的p，结果为左下角：发现p=6时取得最优FID数值。

同时左上角也可以看出wgan-div的收敛速度最快

稳定性实验

4种设置： ResNet, ResNet without BN, ConvNet, ConvNet without BN

实验结果：ResNet 要好于 ConvNet, 有BN 要好于无BN

参考：

1：Wasserstein Divergence for GANs (WGAN-div) 计算W散度 | 莫烦Python

2：WGAN-div：默默无闻的WGAN填坑者（附开源代码） - 知乎

http://www.kler.cn/a/159051.html

相关文章：

智慧垃圾分拣站：科技改变城市环境，创造更美好的未来

OCP Java17 SE Developers 复习题08

MySQL 8.x 自签证书通过keytool和openssl转成JKS文件

剑指 Offer（第2版）面试题 18：删除链表的节点

Canal笔记:安装与整合Springboot模式Mysql同步Redis

MYSQL数据库中运行SQL文件报错

history路由解决刷新出现404的问题

go-fastfds部署心得

四.多表查询

bootstrap中的图标元素可以免费使用

怎么验证公钥和私钥是一对

VMware虚拟机系统CentOS镜像的下载

Hadoop学习笔记（HDP）-Part.13 安装Ranger

【深度学习】回归模型相关重要知识点总结

HarmonyOS学习--初次下载安装和配置环境

SQL Server 2008 使用concat报错

Matlab 镜像变换（2D）

有基础转Go语言学习笔记（2. 基本数据结构篇）

【答疑解惑】什么时候需要将数据集划分为训练集和测试集，什么时候需要划分为训练集、验证集和测试集？

（未传知网）大数据环境下的隐私安全的图像特征提取及应用