当前位置: 首页 > article >正文

AI绘画开源王者归来,Stable Diffusion 3.5 AI绘画模型开源发布

在这里插入图片描述

  • 2024年10月22号,stability发布了 Stable Diffusion 3.5,这是stability迄今为止最强大的模型。今天推出 Stable Diffusion 3.5。此公开版本包含多个型号变体,包括 Stable Diffusion 3.5 Large 和 Stable Diffusion 3.5 Large Turbo。此外,Stable Diffusion 3.5 Medium 将于 10 月 29 日发布。

  • 这些模型的大小高度定制,可在消费级硬件上运行,并且根据宽松的Stability AI 社区许可,可****免费用于商业和非商业用途。

  • 您现在可以从Hugging Face下载 Stable Diffusion 3.5 Large 和 Stable Diffusion 3.5 Large Turbo的开源模型 ,并在GitHub 上下载推理代码。

(需要相关模型和sd3.5的同学可自行扫描获取)

在这里插入图片描述

在这里插入图片描述

实操效果

1. 打开网址
https://huggingface.co/spaces/stabilityai/stable-diffusion-3.5-large-turbo

2. 这个是快速模型,只需要4步即可出图,输入A capybara wearing a suit holding a sign that reads Hello World这段提示词。

在这里插入图片描述

3. 点击设置高级参数,默认参数是4步,效果还可以接受。

在这里插入图片描述

4. 我保持提示词和尺寸不变,种子每次一个随机数,修改步数为8,16,32,50(最大),引导系数保持0,点击RUN生成效果。测试结果对于TRUBO模型,建议4~8步即可,步数变多反而效果会变差生成时间也变长。

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

7.保持步数为8,调整引导系数到0~7.5(每次逐步+0.5)对比看下结果,建议数值小于1.

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

8. SD3.5 large模型示例,这个模型要比上面的TURBO效果好的多,是三种模型中效果最好的,耗费内容和时间也是最多的。

  • collage art ‘We’re Leaving For the Future’ 1980s #vaporwave aesthetic internet art glued layered magazine cutout image shape scrap, torn ragged paper art, BASIC code, halftone, #pixelart

    在这里插入图片描述

  • a captivating anime-style illustration of a young woman in a white astronaut suit. She has long, dark wavy hair. Surrounding the astronaut are vibrant orange flowers with yellow centers. The background itself is a mesmerizing night sky filled with countless stars

在这里插入图片描述

  • Scene of a giant ancient tortoise with a fantasy city built on its back. The tortoise’s shell is covered in lush, dense forest with towering trees and a hidden, misty village nestled in the foliage. The city consists of intricately designed buildings that blend seamlessly with the natural environment, featuring rope bridges connecting different sections of the city

    在这里插入图片描述

  • a portrait of a man standing in front of a white wall. His gaze is directed to the right, looking towards something beyond the frame

    在这里插入图片描述

  • *aesthetic* #boho #fashion, full-body 30-something woman laying on microfloral grass, candid pose, overlay reads Stable Diffusion 3.5, cheerful cursive typography font

在这里插入图片描述

过往SD模型回顾

6 月,stability发布了 Stable Diffusion 3 Medium,这是 Stable Diffusion 3 系列的第一个开放版本。此版本没有完全满足我们的标准或社区的期望。在听取了宝贵的社区反馈后,我们没有采取快速修复措施,而是花时间进一步开发一个版本,以推进我们改造视觉媒体的使命。

Stable Diffusion 3.5 体现了我们致力于为开发者和创作者提供广泛可用、先进且在大多数情况下免费的工具的承诺。我们鼓励在整个流程中分发和货币化工作 - 无论是微调、LoRA、优化、应用程序还是艺术作品。

**发布内容**    

Stable Diffusion 3.5 提供了多种模型,旨在满足科学研究人员、业余爱好者、初创企业和企业的需求:

  • Stable Diffusion 3.5 Large:该基础型号拥有 80 亿个参数,质量卓越,响应迅速,是 Stable Diffusion 系列中最强大的型号。该型号非常适合 1 百万像素分辨率的专业用例。

  • Stable Diffusion 3.5 Large Turbo:Stable Diffusion 3.5 Large 模型的精简版,仅需 4 步即可生成高质量图像,且具有出色的快速依从性,速度比Stable Diffusion 3.5 Large 快得多。

  • Stable Diffusion 3.5 Medium(将于 10 月 29 日发布):该模型拥有 25 亿个参数,采用改进的 MMDiT-X 架构和训练方法,可在消费级硬件上“开箱即用”,在质量和定制易用性之间取得平衡。它能够生成分辨率在 0.25 到 2 百万像素之间的图像。

模型优势

Stable Diffusion 3.5 版本在以下方面表现出色,使其成为市场上最可定制、最易于访问的图像模型之一,同时在及时性和图像质量方面保持顶级性能:

  • 可定制性:轻松微调模型以满足您的特定创作需求,或根据定制的工作流程构建应用程序。

  • 高效性能:经过优化,可在标准消费硬件上运行,无需繁重工作,尤其是 Stable Diffusion 3.5 Medium 和 Stable Diffusion 3.5 Large Turbo 型号。

  • 多样化输出:创建代表世界的图像,而不仅仅是一种类型的人,具有不同的肤色和特征,无需大量提示。

  • 风格多样:能够生成各种风格和美感,如 3D、摄影、绘画、线条艺术以及几乎任何可以想象的视觉风格。

此外,我们的分析表明,Stable Diffusion 3.5 Large在及时遵守方面处于市场领先地位,并且在图像质量方面可与更大的型号相媲美。

Stable Diffusion 3.5 Large Turbo提供了同类模型中最快的推理时间,同时在图像质量和及时性方面保持了高度竞争力,即使与类似尺寸的非蒸馏模型相比也是如此

Stable Diffusion 3.5 Medium 的表现优于其他中型型号,在迅速遵守和图像质量之间实现了平衡,使其成为高效、高质量性能的首选。

  社区许可证一览

我们很高兴根据我们的宽松社区许可证发布此模型。以下是许可证的关键组成部分:

  • 非商业用途免费:个人和组织可以免费将该模型用于非商业用途,包括科学研究。

  • 免费用于商业用途(年收入最高 100 万美元):初创企业、中小型企业和创作者可以免费将该模型用于商业用途,只要他们的年总收入低于 100 万美元。

  • 输出所有权:保留所产生的媒体的所有权,不受限制性许可的影响。

年收入超过 100 万美元的组织,请在此处联系我们,咨询企业许可证。

访问模型更多方式

虽然模型权重现在可以在 Hugging Face 上自托管,但您也可以通过以下平台访问该模型:

  • 1. Stable Diffusion AI API :https://platform.stability.ai/docs/api-reference#tag/Generate/paths/1v2beta1stable-image1generate1sd3/post

  • 2.Replicate:

  • https://replicate.com/stability-ai/stable-diffusion-3.5-large

  • 3. ComfyUI我会单独写教程,讲ComfyUI中如何使用SD3.5?https://blog.comfy.org/sd3-5-comfyui/

    即将推出

10 月 29 日,我们将公开发布 Stable Diffusion 3.5 Medium。不久之后,ControlNets 也将推出,为各种专业用例提供高级控制功能。

感兴趣的小伙伴,赠送全套AIGC学习资料,包含AI绘画、AI人工智能等前沿科技教程和软件工具,具体看这里。

在这里插入图片描述

AIGC技术的未来发展前景广阔,随着人工智能技术的不断发展,AIGC技术也将不断提高。未来,AIGC技术将在游戏和计算领域得到更广泛的应用,使游戏和计算系统具有更高效、更智能、更灵活的特性。同时,AIGC技术也将与人工智能技术紧密结合,在更多的领域得到广泛应用,对程序员来说影响至关重要。未来,AIGC技术将继续得到提高,同时也将与人工智能技术紧密结合,在更多的领域得到广泛应用。
在这里插入图片描述

一、AIGC所有方向的学习路线

AIGC所有方向的技术点做的整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照下面的知识点去找对应的学习资源,保证自己学得较为全面。

在这里插入图片描述
在这里插入图片描述

二、AIGC必备工具

工具都帮大家整理好了,安装就可直接上手!
在这里插入图片描述

三、最新AIGC学习笔记

当我学到一定基础,有自己的理解能力的时候,会去阅读一些前辈整理的书籍或者手写的笔记资料,这些笔记详细记载了他们对一些技术点的理解,这些理解是比较独到,可以学到不一样的思路。

在这里插入图片描述
在这里插入图片描述

四、AIGC视频教程合集

观看全面零基础学习视频,看视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。
在这里插入图片描述

五、实战案例

纸上得来终觉浅,要学会跟着视频一起敲,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。
在这里插入图片描述

在这里插入图片描述


http://www.kler.cn/news/366777.html

相关文章:

  • 论文解析八: GAN:Generative Adversarial Nets(生成对抗网络)
  • 同标签实现监听LocalStorage
  • HBuilder X 中Vue.js基础使用->计算属性的应用(三)
  • supermall项目上拉加载bug分析
  • Django进一步掌握(10月22日)
  • 万字图文实战:从0到1构建 UniApp + Vue3 + TypeScript 移动端跨平台开源脚手架
  • 矩阵的可解性:关于Ax=b的研究
  • WeakHashMap详解
  • 谷粒商城の订单服务分布式事务
  • 京准电钟:NTP网络授时服务器应用航管自控系统
  • jmeter学习(6)逻辑控制器
  • 【Python】Whoosh:全流程自建搜索引擎
  • 【c++篇】:从基础到实践--c++内存管理技巧与模版编程基础
  • 免费的CMS系统有哪些?
  • windows中的tracert命令
  • Apache Paimon介绍
  • IIS下FTP服务器的PASV端口范围修改方法
  • SQL 干货 | SQL 反连接
  • OBOO鸥柏丨液晶拼接大屏分布式基本管理系统架构显示技术曝光
  • python subproces模块
  • 安装Maven配置以及构建Maven项目(2023idea)
  • 智慧铜矿厂综合管控平台 | 图扑软件
  • 计算机网络的主要知识点小结
  • 反向代理服务器---NGINX
  • 【PHP】在ThinkPHP6中Swoole与FPM的简单性能测试对比
  • FullRankMatrix