当前位置: 首页 > article >正文

深度学习之其他常见的生成式模型

1.1 什么是自回归模型:pixelRNN与pixelCNN?

​ 自回归模型通过对图像数据的概率分布 p d a t a ( x ) p_{data}(x) pdata(x)进行显式建模,并利用极大似然估计优化模型。具体如下:
p d a t a ( x ) = ∏ i = 1 n p ( x i ∣ x 1 , x 2 , . . . , x i − 1 ) p_{data}(x)=\prod_{i=1}^np(x_i|x_1,x_2,...,x_{i-1}) pdata(x)=i=1np(xix1,x2,...,xi1)
​ 上述公式很好理解,给定 x 1 , x 2 , . . . , x i − 1 x_1,x_2,...,x_{i-1} x1,x2,...,xi1条件下,所有 p ( x i ) p(x_i) p(xi)的概率乘起来就是图像数据的分布。如果使用RNN对上述依然关系建模,就是pixelRNN。如果使用CNN,则是pixelCNN。具体如下[5]:

在这里插入图片描述

在这里插入图片描述

​ 显然,不论是对于pixelCNN还是pixelRNN,由于其像素值是一个个生成的,速度会很慢。语音领域大火的WaveNet就是一个典型的自回归模型。

1.2 什么是VAE?

​ PixelCNN/RNN定义了一个易于处理的密度函数,我们可以直接优化训练数据的似然;对于变分自编码器我们将定义一个不易处理的密度函数,通过附加的隐变量 z z z对密度函数进行建模。 VAE原理图如下[6]:

在这里插入图片描述

​ 在VAE中,真实样本 X X X通过神经网络计算出均值方差(假设隐变量服从正太分布),然后通过采样得到采样变量 Z Z Z并进行重构。VAE和GAN均是学习了隐变量 z z z到真实数据分布的映射。但是和GAN不同的是:

  • GAN的思路比较粗暴,使用一个判别器去度量分布转换模块(即生成器)生成分布与真实数据分布的距离。
  • VAE则没有那么直观,VAE通过约束隐变量 z z z服从标准正太分布以及重构数据实现了分布转换映射 X = G ( z ) X=G(z) X=G(z)

生成式模型对比

  • 自回归模型通过对概率分布显式建模来生成数据
  • VAE和GAN均是:假设隐变量 z z z服从某种分布,并学习一个映射 X = G ( z ) X=G(z) X=G(z),实现隐变量分布 z z z与真实数据分布 p d a t a ( x ) p_{data}(x) pdata(x)的转换。
  • GAN使用判别器去度量映射 X = G ( z ) X=G(z) X=G(z)的优劣,而VAE通过隐变量 z z z与标准正太分布的KL散度和重构误差去度量。

http://www.kler.cn/a/394141.html

相关文章:

  • IP数据云 识别和分析tor、proxy等各类型代理
  • AUTOSAR_EXP_ARAComAPI的7章笔记(3)
  • Diffusion Policy——斯坦福机器人UMI所用的扩散策略:从原理到其编码实现(含Diff-Control、ControlNet详解)
  • TortoiseSVN提示服务器凭证检核错误:站点名称不符
  • pySpark乱码
  • 【初阶数据结构与算法】链表刷题之移除链表元素、反转链表、找中间节点、合并有序链表、链表的回文结构
  • FairyGUI和Unity联动(入门篇)
  • 第四十章 Vue之使用ESLint修正代码规范
  • C/C++语言基础--C++模板与元编程系列六,C++元编程相关库的讲解与使用
  • 七次课掌握 Photoshop:形状和文字
  • HTTP 1.0、HTTP 1.1 和 HTTP 2.0 区别
  • 《物理学报》
  • jmeter常用配置元件介绍总结之线程组
  • MySQL 8.0特性-自增变量的持久化
  • linux系统网络设置之ssh和nfs
  • Ubuntu 22.04.4 LTS + certbot 做自动续签SSL证书(2024-11-14亲测)
  • 【C#设计模式(9)——组合模式(Component Pattern)】
  • STM32设计学生宿舍监测控制系统
  • 基于Affine-Sift算法的图像配准matlab仿真
  • 【卡尔曼滤波】数据融合Fusion的应用 C语言、Python实现(Kalman Filter)
  • Scala 的Set集合
  • 《青牛科技 GC6125:驱动芯片中的璀璨之星,点亮 IPcamera 和云台控制(替代 BU24025/ROHM)》
  • GPT o1 模型使用及API调用
  • 如何绑定洛谷账号
  • 计算机视觉 ---常见图像文件格式及其特点
  • 均值方差增量计算