当前位置: 首页 > article >正文

CodeFormer模型构建指南

一、介绍

在 NeurIPS 2022 上,南洋理工大学-商汤科技联合研究中心 S-Lab 提出了一种基于 VQGAN+Transformer的人脸复原模型 CodeFormer。基于CodeFormer模型实现面部复原增强旧照片/修复AI艺术面部颜色增强和修复面部修复四个功能。

二、特点

  • CodeFormer 是一个强大的人工智能工具,利用基于变压器的架构和注意力机制,用于恢复旧图像和生成逼真的人工智能面孔。
  • CodeFormer 的深度学习功能通过增强颜色、恢复面部细节和减少噪音来恢复历史照片的活力,保留珍贵的记忆。
  • 通过 CodeFormer 的用户友好界面,预处理图像、选择目标、自定义设置并获得结果,轻松恢复旧照片。
  • CodeFormer 的高级 transformer 架构允许它通过在不同的数据集上进行训练和微调设置来生成高度逼真的 AI 人脸,以获得独特的结果。
  • 负责任地使用和监管人工智能生成的人脸对于避免 deepfakes 等潜在问题至关重要,确保该技术服务于积极和道德的目的。

三、模型搭建

环境要求:

  • 系统ubuntu22.04 、cuda11.8

1. 模型下载

  • 下载CodeFormer模型,输入指令:
 git clone https://github.com/sczhou/CodeFormer

微信截图_20240829103940.png

  • 输入ls,查看一下是否有CodeFormer文件夹
ls

微信截图_20240829104002.png

  • 输入指令 cd CodeFormer进入文件夹
cd CodeFormer

微信截图_20240829104128.png

2. 创建虚拟环境

  • 输入下列命令:
conda create -n codeformer python=3.8 -y

微信截图_20240829104309.png

  • 激活虚拟环境
conda activate codeformer

微信截图_20240829104405.png

3.下载环境的依赖包

  • 输入列命令将下载源换成国内源
pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple/ --trusted-host pypi.douban.com
  • 输入下列命令下载依赖包
pip install -r requirements.txt

微信截图_20240829104657.png

此时出现“tb-nightly”报错,输入下列命令:

(下载完成后重新运行“pip install -r requirements.txt”命令)

pip install tb-nightly -i https://mirrors.aliyun.com/pypi/simple

微信截图_20240829104805.png

  • 输入运行setup.py
python basicsr/setup.py develop

微信截图_20240829112006.png

  • 安装项目缺失包

输入下列命令安装ffmpeg

conda install ffmpeg

微信截图_20240829112103.png

输入下列命令安装ffmpy

pip install ffmpy

微信截图_20240829112537.png

耐心等待所有的安装包下载即可

4. 运行

此时系统的权重文件还未下载,输入指令后系统会自动下载,同时把运行的结果保存到指定的文件夹下。

 特别提醒:如果下载很慢则手动下载模型存储到weights/CodeFormer/目录下

detection_Resnet50_Final.pth 下载模型存储到weights/facelib/目录下

parsing_parsenet 下载模型存储到weights/facelib/目录

codeformer_colorization下载模型存储到weights/CodeFormer/目录下

codeformer_inpainting下载模型存储到weights/CodeFormer/目录下

codeformer.pth下载模型存储到weights/realesrgan/目录下

地址:

https://github.com/sczhou/CodeFormer/releases/download/v0.1.0/codeformer.pth

https://github.com/sczhou/CodeFormer/releases/download/v0.1.0/detection_Resnet50_Final.pth

https://github.com/sczhou/CodeFormer/releases/download/v0.1.0/parsing_parsenet.pth

目录:

/CodeFormer/weights/CodeFormer/codeformer.pth

/CodeFormer/weights/facelib/detection_Resnet50_Final.pth

/CodeFormer/weights/facelib/parsing_parsenet.pth

① 面部复原

输入指令:

python inference_codeformer.py -w 0.5 --has_aligned --input_path inputs/cropped_faces/0143.png

微信截图_20240829113047.png

微信截图_20240829115858.png

② 增强旧照片/修复AI艺术

输入指令:

python inference_codeformer.py -w 0.7 --input_path inputs/whole_imgs/03.jpg

微信截图_20240829122317.png

③ 面部颜色增强和修复

输入指令:

python inference_colorization.py --input_path inputs/cropped_faces/0368.png

微信截图_20240829122644.png

微信截图_20240829123608.png

④ 面部修复

输入指令:

python inference_inpainting.py --input_path inputs/masked_faces/00105.png

微信截图_20240829123031.png

微信截图_20240829124045.png


http://www.kler.cn/a/323502.html

相关文章:

  • 自存 关于RestController请求传参数 前端和后端相关
  • 思源笔记 Creating group siyuan (1000) permission denied (are you root?)
  • Spark RDD sortBy算子什么情况会触发shuffle
  • 第八节 如何结合AAA实现用户远程登录-路由基础
  • C/C++语言基础--initializer_list表达式、tuple元组、pair对组简介
  • 【Linux】系统中负责回收内存的进程和机制有哪些?
  • 网络安全TARA分析
  • [Linux]磁盘分区指令
  • 带你0到1之QT编程:二十、QT与MySQL喜结连理,构建数据库应用开发
  • 大数据电商数仓项目--实战(一)数据准备
  • WebGIS开发及市面上各种二三维GIS开发框架对比分析
  • libreoffice word转pdf
  • 数据结构---顺序表之单链表
  • 关于 spi 的linux 的驱动的问题
  • Java和C语言语法细节(持续更新中)
  • pytorch ----【输入张量.data.size()/输入张量.size()】的使用
  • 基于MATLAB的虫害检测系统
  • Java实现找色和找图功能
  • 每天一道面试题(20):锁的发生原因和避免措施
  • C++ | 定长内存池 | 对象池
  • 【C语言】动态内存管理:malloc、calloc、realloc、free
  • 每天一道面试题(19):Spring Boot 中自动装配机制的原理
  • IIS开启后https访问出错net::ERR_CERT_INVALID
  • EasyExcel使用介绍
  • 【个人笔记】数据一致性的解决方案
  • 10.C++程序中的循环语句