当前位置：首页 > article >正文

AI绘画开源王者归来，Stable Diffusion 3.5 AI绘画模型开源发布

article 2024/10/27 4:21:42

在这里插入图片描述

2024年10月22号，stability发布了 Stable Diffusion 3.5，这是stability迄今为止最强大的模型。今天推出 Stable Diffusion 3.5。此公开版本包含多个型号变体，包括 Stable Diffusion 3.5 Large 和 Stable Diffusion 3.5 Large Turbo。此外，Stable Diffusion 3.5 Medium 将于 10 月 29 日发布。
这些模型的大小高度定制，可在消费级硬件上运行，并且根据宽松的Stability AI 社区许可，可****免费用于商业和非商业用途。
您现在可以从Hugging Face下载 Stable Diffusion 3.5 Large 和 Stable Diffusion 3.5 Large Turbo的开源模型，并在GitHub 上下载推理代码。

(需要相关模型和sd3.5的同学可自行扫描获取)

在这里插入图片描述

实操效果

1. 打开网址
https://huggingface.co/spaces/stabilityai/stable-diffusion-3.5-large-turbo

2. 这个是快速模型，只需要4步即可出图，输入A capybara wearing a suit holding a sign that reads Hello World这段提示词。

在这里插入图片描述

3. 点击设置高级参数，默认参数是4步，效果还可以接受。

在这里插入图片描述

4. 我保持提示词和尺寸不变，种子每次一个随机数，修改步数为8，16，32，50（最大），引导系数保持0，点击RUN生成效果。测试结果对于TRUBO模型，建议4~8步即可，步数变多反而效果会变差生成时间也变长。

在这里插入图片描述

7.保持步数为8，调整引导系数到0~7.5(每次逐步+0.5）对比看下结果，建议数值小于1.

在这里插入图片描述

8. SD3.5 large模型示例，这个模型要比上面的TURBO效果好的多，是三种模型中效果最好的，耗费内容和时间也是最多的。

collage art ‘We’re Leaving For the Future’ 1980s #vaporwave aesthetic internet art glued layered magazine cutout image shape scrap, torn ragged paper art, BASIC code, halftone, #pixelart
a captivating anime-style illustration of a young woman in a white astronaut suit. She has long, dark wavy hair. Surrounding the astronaut are vibrant orange flowers with yellow centers. The background itself is a mesmerizing night sky filled with countless stars

在这里插入图片描述

Scene of a giant ancient tortoise with a fantasy city built on its back. The tortoise’s shell is covered in lush, dense forest with towering trees and a hidden, misty village nestled in the foliage. The city consists of intricately designed buildings that blend seamlessly with the natural environment, featuring rope bridges connecting different sections of the city
a portrait of a man standing in front of a white wall. His gaze is directed to the right, looking towards something beyond the frame
_*aesthetic_* #boho #fashion, full-body 30-something woman laying on microfloral grass, candid pose, overlay reads Stable Diffusion 3.5, cheerful cursive typography font

在这里插入图片描述

过往SD模型回顾

6 月，stability发布了 Stable Diffusion 3 Medium，这是 Stable Diffusion 3 系列的第一个开放版本。此版本没有完全满足我们的标准或社区的期望。在听取了宝贵的社区反馈后，我们没有采取快速修复措施，而是花时间进一步开发一个版本，以推进我们改造视觉媒体的使命。

Stable Diffusion 3.5 体现了我们致力于为开发者和创作者提供广泛可用、先进且在大多数情况下免费的工具的承诺。我们鼓励在整个流程中分发和货币化工作 - 无论是微调、LoRA、优化、应用程序还是艺术作品。

**发布内容**

Stable Diffusion 3.5 提供了多种模型，旨在满足科学研究人员、业余爱好者、初创企业和企业的需求：

Stable Diffusion 3.5 Large：该基础型号拥有 80 亿个参数，质量卓越，响应迅速，是 Stable Diffusion 系列中最强大的型号。该型号非常适合 1 百万像素分辨率的专业用例。
Stable Diffusion 3.5 Large Turbo：Stable Diffusion 3.5 Large 模型的精简版，仅需 4 步即可生成高质量图像，且具有出色的快速依从性，速度比Stable Diffusion 3.5 Large 快得多。
Stable Diffusion 3.5 Medium（将于 10 月 29 日发布）：该模型拥有 25 亿个参数，采用改进的 MMDiT-X 架构和训练方法，可在消费级硬件上“开箱即用”，在质量和定制易用性之间取得平衡。它能够生成分辨率在 0.25 到 2 百万像素之间的图像。

模型优势

Stable Diffusion 3.5 版本在以下方面表现出色，使其成为市场上最可定制、最易于访问的图像模型之一，同时在及时性和图像质量方面保持顶级性能：

可定制性：轻松微调模型以满足您的特定创作需求，或根据定制的工作流程构建应用程序。
高效性能：经过优化，可在标准消费硬件上运行，无需繁重工作，尤其是 Stable Diffusion 3.5 Medium 和 Stable Diffusion 3.5 Large Turbo 型号。
多样化输出：创建代表世界的图像，而不仅仅是一种类型的人，具有不同的肤色和特征，无需大量提示。

风格多样：能够生成各种风格和美感，如 3D、摄影、绘画、线条艺术以及几乎任何可以想象的视觉风格。

此外，我们的分析表明，Stable Diffusion 3.5 Large在及时遵守方面处于市场领先地位，并且在图像质量方面可与更大的型号相媲美。

Stable Diffusion 3.5 Large Turbo提供了同类模型中最快的推理时间，同时在图像质量和及时性方面保持了高度竞争力，即使与类似尺寸的非蒸馏模型相比也是如此

Stable Diffusion 3.5 Medium 的表现优于其他中型型号，在迅速遵守和图像质量之间实现了平衡，使其成为高效、高质量性能的首选。

  社区许可证一览

我们很高兴根据我们的宽松社区许可证发布此模型。以下是许可证的关键组成部分：

非商业用途免费：个人和组织可以免费将该模型用于非商业用途，包括科学研究。
免费用于商业用途（年收入最高 100 万美元）：初创企业、中小型企业和创作者可以免费将该模型用于商业用途，只要他们的年总收入低于 100 万美元。
输出所有权：保留所产生的媒体的所有权，不受限制性许可的影响。

年收入超过 100 万美元的组织，请在此处联系我们，咨询企业许可证。

访问模型更多方式

虽然模型权重现在可以在 Hugging Face 上自托管，但您也可以通过以下平台访问该模型：

1. Stable Diffusion AI API ：https://platform.stability.ai/docs/api-reference#tag/Generate/paths/_1v2beta1stable-image_1generate1sd3/post
2.Replicate：
https://replicate.com/stability-ai/stable-diffusion-3.5-large
3. ComfyUI我会单独写教程，讲ComfyUI中如何使用SD3.5？https://blog.comfy.org/sd3-5-comfyui/

即将推出

10 月 29 日，我们将公开发布 Stable Diffusion 3.5 Medium。不久之后，ControlNets 也将推出，为各种专业用例提供高级控制功能。

。

感兴趣的小伙伴，赠送全套AIGC学习资料，包含AI绘画、AI人工智能等前沿科技教程和软件工具，具体看这里。

在这里插入图片描述

AIGC技术的未来发展前景广阔，随着人工智能技术的不断发展，AIGC技术也将不断提高。未来，AIGC技术将在游戏和计算领域得到更广泛的应用，使游戏和计算系统具有更高效、更智能、更灵活的特性。同时，AIGC技术也将与人工智能技术紧密结合，在更多的领域得到广泛应用，对程序员来说影响至关重要。未来，AIGC技术将继续得到提高，同时也将与人工智能技术紧密结合，在更多的领域得到广泛应用。
在这里插入图片描述