当前位置：首页 > article >正文

AI图像放大工具,图片放大无所不能

article 2025/2/19 6:32:12

AI图像放大工具，如ESRGAN，对于提高由Stable Diffusion生成的AI图像质量至关重要。它们被广泛使用，以至于许多Stable Diffusion的图形用户界面（GUI）都内置了支持。

在这里，我们将学习什么是图像放大器，它们如何工作，以及如何使用它们。

为什么我们需要图像放大器？

Stable Diffusion v1的默认图像大小是512×512像素。**按照今天的标准来看，这相当低。**以iPhone 12为例。它的相机可以产生1200万像素的图像——即4032×3024像素。它的屏幕显示2532×1170像素，所以一个没有被放大的Stable Diffusion的质量是比较差的，不适合在现代的应用中使用。

另外，如果图片的分辨率太低的话，图片就缺少很多细节，使用起来也有诸多不便。

为什么我们不能使用传统的放大器？

传统放大器当然可以使用，但结果不会那么好。

用于调整图像大小的传统算法，如最近邻插值和Lanczos插值，因为仅使用图像的像素值而受到批评。它们通过仅使用图像的像素值执行数学运算来扩大画布并填充新的像素。然而，如果图像本身有损坏或扭曲，这些算法就无法准确填充缺失的信息。

AI放大器是如何工作的？

AI放大器是使用大量数据训练的神经网络模型。它们可以在放大图像的同时填充细节。

在训练过程中，图像被人为地损坏以模拟现实世界的退化。然后训练AI放大器模型以恢复原始图像。

大量的先验知识被嵌入到模型中。它可以填充缺失的信息。这就像人类不需要详细研究一个人的面孔就能记住它一样。我们主要关注几个关键特征。

如何使用AI放大器？

让我们来了解如何在AUTOMATIC1111 WebUI for Stable Diffusion中使用AI放大器。

转到Extras页面，并选择Single Image。

上传你想要放大的图像到source。

设置Resize因子。许多AI放大器可以原生地将图像放大4倍。所以4是一个很好的选择。如果你不希望图像那么大，可以将其设置为较低的值，比如2。

如果你的图像是512×512像素，2倍放大是1024×1024像素，4倍放大是2048×2048像素。

选择R-ESRGAN 4x+，这是一个适用于大多数图像的AI放大器。

按Generate开始放大。

完成后，放大后的图像将出现在右侧的输出窗口中。右键单击图像以保存。

可以看到页面上还有一个upscaler 2的选项，这意味着你可以把两个放大器混合使用。

后面的Upscaler 2 visibility是用来控制使用upscaler 2模型进行放大的比例。

0表示完全不是用，1表示只使用upscaler 2。

AI放大器选项

让我们来了解一些值得注意的AI放大器选项。

LDSR

Latent Diffusion Super Resolution (LDSR)放大器最初与Stable Diffusion 1.4一起发布。它是一个训练用于执行放大任务的潜在扩散模型。尽管它提供了卓越的质量，但它非常慢。我不建议使用它。

ESRGAN 4x

Enhanced Super-Resolution Generative Adversarial Networks (ESRGAN)是一个放大网络，赢得了2018年感知图像恢复和操作挑战赛。它是之前SRGAN模型的增强版。它倾向于保留细节并产生清晰锐利的图像。ESRGAN是许多其他放大器的基础模型。