当前位置: 首页 > article >正文

Pulid:pure and lightning id customization via contrastive alignment

1.introduction

基于微调的方案,对每个id进行定制需要花费数十分钟。另一项研究则放弃了对每个id进行微调,而是选择在一个庞大的肖像数据集上预训练一个id适配器。这些方法通常利用编码器例如clip来提取id特征,提取的特征随后以特定方式例如嵌入到cross attention集成到基础扩散模型中,挑战:1.理想的id只改变与id相关的方面,而不改变背景、照明、构图和风格。id嵌入之后会出现退化。id嵌入仍需要保留t2i模型的prompt遵循能力,这通常意味着能够通过提示改变id属性(年龄、性别、表情和发型)、方向和配饰(眼镜)。为了实现这些功能,目前的解决方案一般分为两种,第一类涉及增强编码器,ipadapter从早期的clip中提取特征转变为使用人脸识别backbone来提取更为抽象和相关的id信息,尽管可编辑性得到改善,但id的保真度仍然不够高,instantid在次基础上加入了额外的id&landmark controlnet以实现更有效的调节,牺牲了一些可编辑性和灵活性。2.缺乏保真度,gan时代的经验,提高id保真度的一个直接想法是在扩散训练中引入id loss,扩散模型需要迭代去噪


http://www.kler.cn/a/406076.html

相关文章:

  • 快速图像识别:落叶植物叶片分类
  • UCI Heart Disease Data Set—— UCI 心脏病数据集介绍
  • 缓存工具类编写
  • python小课堂(一)
  • WPF如何全局应用黑白主题效果
  • maven父子项目
  • 华为HCCDA云技术认证--数据库服务
  • 上海乐鑫科技总代理商ESP32-C5,2.45GHz双频Wi-Fi6,高效连接更安全
  • 向量数据库FAISS之六:如何让FAISS更快
  • Memecoin市场热潮:破圈与挑战并存
  • 基于现金红包营销活动的开源 AI 智能名片与 S2B2C 商城小程序融合发展研究
  • HARCT 2025 新增分论坛6:基于机器人的智能处理控制
  • vue2 src_Todolist消息订阅版本
  • 15分钟学 Go 第 60 天 :综合项目展示 - 构建微服务电商平台(完整示例25000字)
  • 使用Faiss构建音频特征索引并计算余弦相似度
  • 基于机器视觉的表面缺陷检测
  • MySQL慢查询怎么解决
  • 动态规划-用集合的角度推导状态转移方程 — 最长上升子序列(LIS)
  • MCU通过APB总线与FPGA 数据交互(实现JATG 模块的控制)
  • Matlab|计及调峰主动性的风光水火储多能系统互补协调优化调度
  • C#里演示使用路径类Path
  • 2022 年中高职组“网络安全”赛项-海南省省竞赛任务书-1-B模块B-1-Windows操作系统渗透测试
  • Matlab函数中的隐马尔可夫模型
  • Java安全—JNDI注入RMI服务LDAP服务JDK绕过
  • AP+AC组网——STA接入
  • 大数据治理:构建数据驱动决策的核心基石