当前位置：首页 > article >正文

论文阅读笔记：Denoising Diffusion Implicit Models

article 2025/3/31 10:15:40

1、参考来源

论文《Denoising Diffusion Implicit Models》
来源：ICLR2021
https://iclr.cc/virtual/2021/poster/2804
论文链接：https://arxiv.org/abs/2010.02502
代码链接：https://github.com/ermongroup/ddim

2、符号表示的不同

在论文DDPM《Denoising Diffusion Implicit Models》当中，前向传播过程的 $q(x_{t-1}|x_t,x_0)\sim N\big(x_{t-1};\widetilde{\mu}_t(x_t,x_0),\sigma_t\big)$ 。并且 $\widetilde{\mu}_t(x_t,x_0)和\sigma_t$ 分别如公式（1）所示。
$\begin{equation} \begin{split} \sigma_t&=\sqrt{\frac{\beta_t\cdot (1-\bar{\alpha_{t-1}})}{(1-\bar{\alpha_{t}})}}\\ \widetilde{\mu}_t(x_t,x_0)&=\frac{\sqrt{\alpha_t}\cdot(1-\bar{\alpha_{t-1}})}{1-\bar{\alpha_t}}\cdot x_t+\frac{\beta_t\cdot \sqrt{\bar{\alpha_{t-1}}}}{1-\bar{\alpha_t}} \cdot x_0 \\ \end{split} \end{equation}$
在DDIM《Denoising Diffusion Implicit Models》中对符号进行了重新定义。具体来说使用 $\alpha_t$ 替换掉了 $\bar\alpha_t$ ，而在DDPM当中
$\begin{equation} \begin{split} \bar \alpha_t=\prod_{0}^{t}\alpha_i \end{split} \end{equation}$
因此，在DDIM中会发生一些变化，例如 $\beta_t$ 的改变如公式（3）所示。
$\begin{equation} \begin{split} \beta_t&=1-\alpha_t (DDPM)\\ &=1-\frac{\alpha_t}{\alpha_{t-1}} (DDIM)\\ \end{split} \end{equation}$
前向加噪过程中的 $q(x_{t-1}|x_t,x_0)$ 分布的方差和均值分别如公式（4）和（5）所示。
$\begin{equation} \begin{split} \sigma_t^2&=\frac{1-\bar{\alpha}_{t-1}}{1-\bar{\alpha_t}}\cdot \beta_t(DDPM)\\ &=\frac{1-\alpha_{t-1}}{1-\alpha_t}\cdot (1-\frac{\alpha_t}{\alpha_{t-1}}) (DDIM) \end{split} \end{equation}$
$\begin{equation} \begin{split} \widetilde{\mu}_t(x_t,x_0)&=\frac{\sqrt{\alpha_t}\cdot(1-\bar\alpha_{t-1})}{1-\bar{\alpha_t}}\cdot x_t+\frac{\beta_t\cdot \sqrt{\bar\alpha_{t-1}}}{1-\bar{\alpha_t}} \cdot x_0 （DDPM）\\ &=\frac{\sqrt{\alpha_t}\cdot(1-\alpha_{t-1})}{\sqrt{\alpha_{t-1}}\cdot(1-\alpha_t)}\cdot x_t+(1-\frac{\alpha_t}{\alpha_{t-1}})\cdot\frac{\sqrt{\alpha_{t-1}}}{1-\alpha_t}\cdot x_0 (DDIM)\\ &= \sqrt{\frac{\alpha_t\cdot (1-\alpha_{t-1})^2}{\alpha_{t-1} \cdot (1-\alpha_t)^2}}\cdot x_t+\frac{\alpha_{t-1}-\alpha_t}{\alpha_{t-1}}\cdot\frac{\sqrt{\alpha_{t-1}}}{1-\alpha_t}\cdot x_0 \\ &=\sqrt{\frac{1-\alpha_{t-1}}{1-\alpha_{t}}\cdot \frac{\alpha_t-\alpha_t \cdot \alpha_{t-1}}{\alpha_{t-1}-\alpha_{t-1}\cdot \alpha_{t}}} \cdot x_t+\frac{\alpha_{t-1}-\alpha_t}{\sqrt{ \alpha_{t-1}}\cdot (1-\alpha_t)}\cdot x_0 \\ &=\sqrt{\frac{1-\alpha_{t-1}}{1-\alpha_{t}}\cdot \frac{\alpha_t+\alpha_{t-1}-\alpha_{t-1}-\alpha_t \cdot \alpha_{t-1}}{\alpha_{t-1}-\alpha_{t-1}\cdot \alpha_{t}}} \cdot x_t+\frac{\alpha_{t-1}-\alpha_t\cdot \alpha_{t-1}+\alpha_t\cdot \alpha_{t-1}-\alpha_t}{\sqrt{ \alpha_{t-1}}\cdot (1-\alpha_t)}\cdot x_0 \\ &=\sqrt{\frac{1-\alpha_{t-1}}{1-\alpha_{t}}\cdot \Big(1+\frac{\alpha_t-\alpha_{t-1}}{\alpha_{t-1}-\alpha_{t-1}\cdot \alpha_{t}}\Big)}\cdot x_t+\frac{\alpha_{t-1}\cdot (1-\alpha_t)-\alpha_t\cdot (1-\alpha_{t-1})}{\sqrt{ \alpha_{t-1}}\cdot (1-\alpha_t)}\cdot x_0 \\ &=\sqrt{\frac{1-\alpha_{t-1}}{1-\alpha_{t}}\cdot \Big(1-\frac{\alpha_{t-1}-\alpha_t}{\alpha_{t-1}-\alpha_{t-1}\cdot \alpha_{t}}\Big)}\cdot x_t+ \bigg[ \sqrt{\alpha_{t-1}}-\frac{\alpha_t\cdot (1-\alpha_{t-1})}{\sqrt{ \alpha_{t-1}}\cdot (1-\alpha_t)} \bigg] \cdot x_0 \\ &=\sqrt{\frac{1}{1-\alpha_{t}}\cdot \Big(1-\alpha_{t-1}-\frac{(\alpha_{t-1}-\alpha_t)\cdot (1-\alpha_{t-1})}{\alpha_{t-1}-\alpha_{t-1}\cdot \alpha_{t}}\Big)}\cdot x_t+ \bigg[ \sqrt{\alpha_{t-1}}-\frac{\sqrt{\alpha_t^2\cdot (1-\alpha_{t-1})^2}}{\sqrt{ \alpha_{t-1}}\cdot (1-\alpha_t)} \bigg] \cdot x_0 \\ &=\sqrt{\frac{1}{1-\alpha_{t}}\cdot \Big(1-\alpha_{t-1}-\underbrace{\frac{(\alpha_{t-1}-\alpha_t)\cdot (1-\alpha_{t-1})}{\alpha_{t-1}\cdot (1- \alpha_{t})}}_{=\sigma_t^2}\Big)}\cdot x_t+ \bigg[ \sqrt{\alpha_{t-1}}-\frac{\sqrt{\alpha_t\cdot (1-\alpha_{t-1})\cdot(\alpha_t-\alpha_t\cdot \alpha_{t-1})}}{\sqrt{ \alpha_{t-1}}\cdot (1-\alpha_t)} \bigg] \cdot x_0 \\ &=\sqrt{\frac{1}{1-\alpha_{t}}\cdot \Big(1-\alpha_{t-1}-\sigma_t^2 \Big)}\cdot x_t+ \bigg[ \sqrt{\alpha_{t-1}}-\frac{\sqrt{\alpha_t\cdot (1-\alpha_{t-1})\cdot(\alpha_t + \alpha_{t-1} -\alpha_{t-1}-\alpha_t\cdot \alpha_{t-1})}}{\sqrt{ \alpha_{t-1}\cdot(1-\alpha_t)}\cdot (\sqrt{1-\alpha_t})} \bigg] \cdot x_0 \\ &=\sqrt{\frac{1-\alpha_{t-1}-\sigma_t^2}{1-\alpha_{t}}}\cdot x_t+ \bigg[\sqrt{\alpha_{t-1}}- \frac{\sqrt{1-\alpha_{t-1}}}{\sqrt{1-\alpha_t}} \cdot \frac{ \sqrt{ \alpha_t \cdot \big(\alpha_t-\alpha_{t-1}+\alpha_{t-1}\cdot(1-\alpha_t)\big)}}{\sqrt{ \alpha_{t-1}\cdot(1-\alpha_t)}} \bigg] \cdot x_0 \\ &=\sqrt{\frac{1-\alpha_{t-1}-\sigma_t^2}{1-\alpha_{t}}}\cdot x_t+ \bigg[\sqrt{\alpha_{t-1}}- \frac{\sqrt{1-\alpha_{t-1}}}{\sqrt{1-\alpha_t}} \cdot \sqrt{ \frac{ \alpha_t \cdot \big(\alpha_t-\alpha_{t-1}+\alpha_{t-1}\cdot(1-\alpha_t)\big)}{\alpha_{t-1}\cdot(1-\alpha_t)}} \bigg] \cdot x_0 \\ &=\sqrt{\frac{1-\alpha_{t-1}-\sigma_t^2}{1-\alpha_{t}}}\cdot x_t+ \bigg[\sqrt{\alpha_{t-1}}- \frac{\sqrt{1-\alpha_{t-1}}}{\sqrt{1-\alpha_t}} \cdot \sqrt{ \alpha_t\cdot \Big(1+\frac{ \alpha_t-\alpha_{t-1}}{\alpha_{t-1}\cdot(1-\alpha_t)}} \Big)\bigg] \cdot x_0 \\ &=\sqrt{\frac{1-\alpha_{t-1}-\sigma_t^2}{1-\alpha_{t}}}\cdot x_t+ \bigg[\sqrt{\alpha_{t-1}}- \frac{1}{\sqrt{1-\alpha_t}} \cdot \sqrt{ (1-\alpha_{t-1}) \cdot \alpha_t\cdot \Big(1-\frac{\alpha_{t-1} - \alpha_t}{\alpha_{t-1}\cdot(1-\alpha_t)}} \Big)\bigg] \cdot x_0 \\ &=\sqrt{\frac{1-\alpha_{t-1}-\sigma_t^2}{1-\alpha_{t}}}\cdot x_t+ \bigg[\sqrt{\alpha_{t-1}}- \frac{1}{\sqrt{1-\alpha_t}} \cdot \sqrt{ \alpha_t\cdot \Big(1-\alpha_{t-1}-\underbrace{ \frac{(\alpha_{t-1} - \alpha_t)\cdot (1-\alpha_{t-1})}{\alpha_{t-1}\cdot(1-\alpha_t)}}_{\sigma_t^2}} \Big)\bigg] \cdot x_0 \\ &=\sqrt{\frac{1-\alpha_{t-1}-\sigma_t^2}{1-\alpha_{t}}}\cdot x_t+ \bigg[\sqrt{\alpha_{t-1}}- \frac{1}{\sqrt{1-\alpha_t}} \cdot \sqrt{ \alpha_t\cdot (1-\alpha_{t-1}-\sigma_t^2} )\bigg] \cdot x_0 \\ &=\sqrt{\frac{1-\alpha_{t-1}-\sigma_t^2}{1-\alpha_{t}}}\cdot x_t+ \bigg[\sqrt{\alpha_{t-1}}- \frac{\sqrt{ \alpha_t\cdot (1-\alpha_{t-1}-\sigma_t^2} )}{\sqrt{1-\alpha_t}} \bigg] \cdot x_0 \\ \end{split} \end{equation}$

因此，前向传播过程中的 $q(x_{t-1}|x_t,x_0)\sim N(x_{t-1};\sqrt{\frac{1-\alpha_{t-1}-\sigma_t^2}{1-\alpha_{t}}}\cdot x_t+ \bigg[\sqrt{\alpha_{t-1}}- \frac{\sqrt{ \alpha_t\cdot (1-\alpha_{t-1}-\sigma_t^2} )}{\sqrt{1-\alpha_t}} \bigg] \cdot x_0,\sigma_t^2 I)$