当前位置: 首页 > article >正文

【论文阅读】Face2Diffusion for Fast and Editable Face Personalization

code:mapooon/Face2Diffusion: [CVPR 2024] Face2Diffusion for Fast and Editable Face Personalization https://arxiv.org/abs/2403.05094 (github.com)

论文

介绍 

面部个性化旨在将从图像中获取的特定面部插入到预先训练的文本到图像扩散模型中。然而,由于对训练样本的过度拟合,以前的方法在保持身份相似性和可编辑性方面仍然具有挑战性。在本文中,我们提出了 Face2Diffusion (F2D),用于高可编辑性面部个性化。 F2D 背后的核心思想是从训练管道中删除与身份无关的信息可以防止过度拟合问题并提高编码面部的可编辑性。 F2D由以下三个新颖的组件组成:1)多尺度身份编码器提供了良好解开的身份特征,同时保留了多尺度信息的优势,从而提高了相机姿势的多样性。 2)表情引导,将人脸表情与身份分离,提高人脸表情的可控性。 3)分类引导去噪正则化鼓励模型学习如何对面部进行去噪,从而增强背景的文本对齐。对 FaceForensics++ 数据集的大量实验和多样化的提示表明,与之前最先进的方法相比,我们的方法极大地改善了身份保真度和文本保真度之间的权衡。

 

方法

实验

 

 

 

 

 

复现


http://www.kler.cn/news/306816.html

相关文章:

  • 【FATFS】FATFS简介及下载
  • 接口与抽象类
  • Spring Boot 集成 MongoDB - 入门指南
  • 【CTF Web】BUUCTF BUU BURP COURSE 1 Writeup(X-Real-IP伪造+POST请求)
  • mysql 8.0 时间维度表生成(可运行)
  • VMware Workstation Player虚拟机Ubuntu启用Windows共享目录
  • 网络通信开课作业c++
  • k8s证书过期处理
  • Scratch植物大战僵尸【机器人vs外星人版本】
  • 【Go】Go语言中的数组基本语法与应用实战
  • RecyclerView的子项长按选择功能
  • 幼儿与非幼儿识别系统源码分享
  • 【C++】多态,要这样学
  • PFC理论基础与Matlab仿真模型学习笔记(1)--PFC电路概述
  • requests-html的具体使用方法有哪些?
  • Docker安装mysql安装nginx安装Redis
  • 蓝桥杯18小白第5题
  • labview串口大数据量报错的一种解决思路(通过tcp进行写入和读取串口数据)
  • 最小二乘估计
  • ubuntu使用wireshark抓取数据
  • 【Scala入门学习】Scala的方法和函数
  • 【Go】十五、分布式系统、Consul服务注册发现、Nacos配置中心搭建
  • Rust 赋能前端: 视频抽帧
  • 【Python】基本使用
  • 构建高效入学审核系统:Spring Boot解决方案
  • 开源模型应用落地-qwen2-7b-instruct-LoRA微调-unsloth(让微调起飞)-单机单卡-V100(十六)
  • visual studio给项目增加eigen库 手把手教程
  • AI客服机器人开启企业客户服务新纪元
  • 外网(公网)访问VMware workstation 虚拟机内web网站的配置方法---端口转发总是不成功的原因
  • 动手学深度学习(pytorch)学习记录29-网络中的网络(NiN)[学习记录]