当前位置: 首页 > article >正文

【论文阅读】Face2Diffusion for Fast and Editable Face Personalization

code:mapooon/Face2Diffusion: [CVPR 2024] Face2Diffusion for Fast and Editable Face Personalization https://arxiv.org/abs/2403.05094 (github.com)

论文

介绍 

面部个性化旨在将从图像中获取的特定面部插入到预先训练的文本到图像扩散模型中。然而,由于对训练样本的过度拟合,以前的方法在保持身份相似性和可编辑性方面仍然具有挑战性。在本文中,我们提出了 Face2Diffusion (F2D),用于高可编辑性面部个性化。 F2D 背后的核心思想是从训练管道中删除与身份无关的信息可以防止过度拟合问题并提高编码面部的可编辑性。 F2D由以下三个新颖的组件组成:1)多尺度身份编码器提供了良好解开的身份特征,同时保留了多尺度信息的优势,从而提高了相机姿势的多样性。 2)表情引导,将人脸表情与身份分离,提高人脸表情的可控性。 3)分类引导去噪正则化鼓励模型学习如何对面部进行去噪,从而增强背景的文本对齐。对 FaceForensics++ 数据集的大量实验和多样化的提示表明,与之前最先进的方法相比,我们的方法极大地改善了身份保真度和文本保真度之间的权衡。

 

方法

实验

 

 

 

 

 

复现


http://www.kler.cn/a/306816.html

相关文章:

  • Elasticsearch中什么是倒排索引?
  • go do sth和come do sth的区别
  • 服务器数据恢复—分区结构被破坏的reiserfs文件系统数据恢复案例
  • 动态规划 —— dp 问题-买卖股票的最佳时机IV
  • 软件测试学习记录 Day1
  • FFmpeg将mp4的文件转化为m4a
  • 【FATFS】FATFS简介及下载
  • 接口与抽象类
  • Spring Boot 集成 MongoDB - 入门指南
  • 【CTF Web】BUUCTF BUU BURP COURSE 1 Writeup(X-Real-IP伪造+POST请求)
  • mysql 8.0 时间维度表生成(可运行)
  • VMware Workstation Player虚拟机Ubuntu启用Windows共享目录
  • 网络通信开课作业c++
  • k8s证书过期处理
  • Scratch植物大战僵尸【机器人vs外星人版本】
  • 【Go】Go语言中的数组基本语法与应用实战
  • RecyclerView的子项长按选择功能
  • 幼儿与非幼儿识别系统源码分享
  • 【C++】多态,要这样学
  • PFC理论基础与Matlab仿真模型学习笔记(1)--PFC电路概述
  • requests-html的具体使用方法有哪些?
  • Docker安装mysql安装nginx安装Redis
  • 蓝桥杯18小白第5题
  • labview串口大数据量报错的一种解决思路(通过tcp进行写入和读取串口数据)
  • 最小二乘估计
  • ubuntu使用wireshark抓取数据