【 模型】 开源图像模型Stable Diffusion入门手册
开源图像模型Stable Diffusion入门手册
- 引言
- 硬件要求
- 环境部署
- 手动部署
- 整合包
- 模型装配
- 更新
- 显存优化
- 插件配置
- 文生图最简流程
- 提示词使用技巧
- 结语
引言
Stable Diffusion是一款在2022年发布的深度学习文字到图像生成模型。它能够根据文字描述生成详细的图像,并且在几秒钟内创作出令人惊叹的艺术作品。本文将为你提供一份使用Stable Diffusion的入门教程。
硬件要求
- 内存: 建议使用不少于16GB的内存。
- 硬盘空间: 需要60GB以上的空间。
- 显卡: 推荐使用NVIDIA显卡(CUDA架构),虽然已有对AMD显卡的支持,但速度较慢。
环境部署
手动部署
- 安装Python: 安装Python 3.10,并确保在安装时选中“Add Python to PATH”。
- 安装Git: 从git-scm.com下载并安装Git。
- 克隆仓库:
- 按下
Win+R
,输入cmd
,调出命令行窗口。 - 运行以下命令克隆Stable Diffusion WebUI的GitHub仓库:
cd path_to_clone git clone https://github.com/automatic1111/stable-diffusion-webui.git
- 将
path_to_clone
替换为你希望下载的目录。
- 按下
整合包
如果你觉得手动部署麻烦,可以使用整合包,解压即用。例如,独立研究员的空间下经常更新整合包,秋叶的启动器也非常好用。
模型装配
- 下载模型: 在如Civitai上下载标注有ckpt的模型。
- 放置模型: 将下载的模型放入
models/stable-diffusion
目录。 - 运行WebUI: 双击运行
webui-user.bat
。脚本会自动下载依赖,等待一段时间后,程序会输出一个类似http://127.0.0.1:7860/
的地址,在浏览器中输入这个链接即可。
更新
- 更新仓库:
- 按下
Win+R
,输入cmd
,调出命令行窗口。 - 运行以下命令更新仓库:
cd path_to_clone git pull
- 将
path_to_clone
替换为你下载仓库的目录。
- 按下
显存优化
根据显卡实际显存选择优化量,不要超过当前显卡显存。建议开启xformers以改善内存消耗和速度。
插件配置
Stable Diffusion可配置大量插件扩展,在WebUI的“扩展”选项卡下,可以安装插件。
文生图最简流程
- 选择模型: 选择需要使用的模型(底模)。
- 填写提示词: 在第一个框中填入提示词(prompt),对想要生成的东西进行文字描述。
- 填写负面提示词: 在第二个框中填入负面提示词(negative prompt),描述你不想要生成的内容。
- 选择参数: 选择采样方法、采样次数、图片尺寸等参数。
- 生成图像: 点击“生成”按钮,等待图像生成。
提示词使用技巧
- 自然语言: 使用描述物体的句子作为提示词。
- 单词标签: 使用逗号隔开的单词作为提示词。
- Emoji和颜文字: Emoji表情符号也非常准确。
- 语法: 根据自己想画的内容写出提示词,多个提示词之间使用英文半角符号[ , ]。
结语
Stable Diffusion是一款功能强大的图像生成模型,通过合理的配置和使用,可以创作出高质量的图像作品。