当前位置: 首页 > article >正文

基于文生图模型的创新应用

1. IN-CONTEXT LORA FOR DIFFUSION TRANSFORMERS

论文地址

解决的问题

如何低成本快速实现组图的生成

核心原理

利用基础模型的生成能力,使用lora+sdedit(inpainting)实现组图的生成,并保证组图间内容的关联和连续性。仅通过lora激活和加强基础模型生成组图能力,并设计构建prompt实现组图的输出

prompt的构建
prompt构建方式:整个组图描述+每张图的具体描述,用[IMAGE*]来标识每张图片的起始描述,用<*>来定义任务,以保持组图内人物id的连续性
在这里插入图片描述
SDEdit
无参考图时直接文生图生成大图,然后切分成需要的小图;
有参考图时采用SDEdit方案(inpainting),输入含参考图的大图,剩余部分mask掉,让模型去生成:
在这里插入图片描述


http://www.kler.cn/a/461478.html

相关文章:

  • 【网络】什么是路由协议(Routing Protocols)?常见的路由协议包括RIP、OSPF、EIGRP和BGP
  • 二维码文件在线管理系统-收费版
  • aardio —— 虚表 —— 模拟属性框
  • 十二、Vue 路由
  • JavaWeb开发(五)Servlet-ServletContext
  • html 音频和视频组件
  • 《量子AI:突破量子比特稳定性与容错性的关键瓶颈》
  • Cursor小试2.pdf转图片
  • Mac连接云服务器工具推荐
  • Unreal Engine 5 C++ Advanced Action RPG 三、四章笔记
  • 1177:奇数单增序列
  • vue中修改局部的elmentUI样式
  • Python将两个视频横向的拼接--视频效果对比
  • yolo数据集 - 2130张边坡排水沟堵塞数据集分享 - 无人机采集与数据增强处理
  • 计算机毕业设计Python深度学习美食推荐系统 美食可视化 美食数据分析大屏 美食爬虫 美团爬虫 机器学习 大数据毕业设计 Django Vue.js
  • KAFKA入门:原理架构解析
  • 自建私有云相册:Docker一键部署Immich,照片视频备份利器
  • C14.【C++ Cont】string类字符串的push_back、pop_back、字符串+=与+运算和insert
  • 要在 C++ 中实现一个函数,该函数接收一个函数指针 a 并在等待 3 秒后调用它
  • 使用Python实现量子密码学的探索
  • Linux Debian安装ClamAV和命令行扫描病毒方法,以及用Linux Shell编写了一个批量扫描病毒的脚本
  • uniapp——微信小程序读取bin文件,解析文件的数据内容(三)
  • 118.杨辉三角120.三角形最小路径和
  • docker加速镜像和加速镜像配置
  • 基于FPGA的辩论赛系统设计-8名选手-正反两方-支持单选手评分-正反两方评分总和
  • 小程序分包优化实践:解决主包过大和vendor.js体积问题