当前位置: 首页 > article >正文

Stable Diffusion绘画 | 来训练属于自己的模型:打标处理与优化

上一篇完成的打标工作,是为了获取提示词,让AI认识和学习图片的特征。

因此,合适、恰当、无误的提示词,对最终模型效果是相当重要的。

Tag 如何优化

通过软件自动生成的 Tag 只是起到快速建立大体架构的作用,里面会涉及到一些识别错误、重复的词,以及一部分没有识别出来的图片特征。

因此,我们需要在自动生成 Tag 的基础上,再来对应一个个图片进行手动调整,

从而达到减少过度拟合,提高泛用性的效果。

Tag 的保留与删除

我们可以按照 主题+静态特征+动态特征+视角+环境+其他 的公式来考虑补充提示词。

21

主体:1woman

静态特征:blonde hair, blue eyes, red lips

动态特征:looking at viewer, smile

视角:upper body

环境:night

其他:Blurred background

关于 Tag 的是否要保留的原则:

首先要确定哪些特征需要保留?

  • 要保留的特征,就不要记录特征 Tag;

  • 不需要保留,想自定义的特征,记录 Tag

如何批量修改 Tag

BooruDatasetTagManager:https://github.com/starik222/BooruDatasetTagManager/releases

image-20240907144127892

下载解压后,双击 BooruDatasetTagManager.exe 运行:

image-20240907144315872

首选设置,修改系统语言、翻译语言:

image-20240907144617498

image-20240907144712847

加载图片文件夹,读取上一篇在 cybertronfurnace 生成的打标文件夹:

image-20240907145325713

翻译所有标签:

image-20240907145531589

显示标签出现次数:

image-20240907201519581

接下来,就是通过这个软件, 认真细致地对各个图片的便签进行优化和调整。

是一件比较枯燥的事,需要有足够的耐心。

今天先分享到这里~


开启实践:SD绘画 | 为你所做的学习过滤


http://www.kler.cn/a/329912.html

相关文章:

  • 无公网IP 实现外网访问本地 Docker 部署 Navidrome
  • 回归预测 | MATLAB实SVM支持向量机多输入单输出回归预测
  • 梁山派入门指南4——定时器使用详解,包括定时器中断、PWM产生、输入捕获测量频率
  • VLANIF配置之区别(Differences in VLANIF Configuration)
  • flutter在使用gradle时的加速
  • Outlook 无网络连接[2604] 错误解决办法
  • 接口测试入门:深入理解接口测试!【电商API接口测试】
  • 【Qt】系统相关学习--底层逻辑--代码实践
  • 【Redis】主从复制(上)
  • linux文件编程_进程通信
  • 《中安未来护照阅读器 —— 机场高效通行的智慧之选》
  • 一、前后端分离及drf的概念
  • 15 种高级 RAG 技术 从预检索到生成
  • Linux开发讲课45--- 链表
  • 音视频入门基础:FLV专题(8)——FFmpeg源码中,解码Tag header的实现
  • 【重学 MySQL】五十一、更新和删除数据
  • 没有做商标变更,还做不成商标复审!
  • 自动化运维工具 Ansible
  • C++ 隐式内联函数
  • VSCODE驯服日记(四):配置SFML图形环境
  • 波阻抗,是电场矢量的模值/磁场矢量的模值
  • SQL常用语法
  • DpCas 镜头场景分割 Scene Segmentation
  • 基于微信小程序爱心领养小程序设计与实现(源码+定制+开发)
  • MySQL存储和处理XML数据
  • 数据分析-28-交互式数据分析EDA工具和低代码数据科学工具