当前位置：首页 > article >正文

车辆重识别（2021ICML改进的去噪扩散概率模型）论文阅读2024/9/29

article 2025/4/2 14:48:29

所谓改进的去噪扩散概率模型主要改进在哪些方面：
①对数似然值的改进
通过对噪声的那个方差和T进行调参，来实现改进。
②学习 $\sum _{\theta }(x_{t},t)$

这个参数也就是后验概率的方差。通过数据分析，发现在T非常大的情况下 $\sum _{\theta }(x_{t},t)$ 对样本质量几乎没有影响，也就是说随着我们增加更多的扩散步数，μ比 $\sum _{\theta }(x_{t},t)$ 更有影响力。但是通过分析发现，扩散过程中前几步对loss值贡献最大，那么我们可以对 $\sum _{\theta }(x_{t},t)$ 调整。通过实验发现，将 $\sum _{\theta }(x_{t},t)$ 的值确定在噪声方差和后验概率方差之间效果最好。顺便，我们将loss公式改为 $L_{hybrid}=L_{simple}+\lambda L_{vlb}$ 。将 $\lambda$ 确定为一个较小的值，保证 $L_{simple}$ 仍然是主要影响源。

③改善噪声时间表

我们发现之前的噪声时间表对于高分辨率的图像效果比较好，但是对于分辨率为64×64和32×32的图像效果不好。这项操作改变了每一时间步所加的噪声，进而改变了后续数据的分布。我们可以暂且认为控制了每一时间步所加入的噪声量，使得原本图像更慢地变为纯噪声数据，如果像之前的线性时间表，可能会出现图像已经变成纯噪声数据了，但是时间步还没到T，导致不断向图像加噪声，使得难以训练。

④降低梯度噪声

通过分析发现loss值是非常难优化的，因为梯度很嘈杂，也就是说梯度受到输入数据等其他因素影响非常大。这时候我们采取的方法是，把原来的loss值分解为各个时间步的loss值，对每个时间步的loss值进行优化，最后赋予权重，加起来求期望。如下图所示：