当前位置: 首页 > article >正文

SadTalker模型部署教程

一、介绍

SadTalker模型是一个基于深度学习的开源模型,主要是用于根据图片和音频文件自动生成人物说话的动画视频。该模型通过接收一张图片和一段音频文件,能够自动生成包含人脸动作(如张嘴、眨眼、移动头部等)的说话动画视频。

二、部署过程

环境配置要求:

系统:Ubuntu20.4系统,

显卡:RTX 3060 12G,

CUDA: 11.3 ,

miniconda3

1.模型下载

下载SadTalker模型,输入下列指令:

git clone https://gitclone.com/github.com/OpenTalker/SadTalker.git

微信截图_20240809170346.png

2.创建虚拟Python环境

首先使用命令进入SadTalker:

cd SadTalker

使用下列命令创建名称为sadtalker,python版本号为3.8的虚拟环境

conda create -n sadtalker python=3.8

微信截图_20240809170359.png

3.进入虚拟环境

使用下列命令进入:

conda activate sadtalker

微信截图_20240809170413.png

4.下载依赖包

使用下列命令:

pip install torch==1.12.1+cu113 torchvision==0.13.1+cu113 torchaudio==0.12.1 --extra-index-url https://download.pytorch.org/whl/cu113

conda install ffmpeg

pip install -r requirements.txt

微信截图_20240809171209.png

5.下载模型权重文件

使用下列命令进行下载:

bash scripts/download_models.sh

微信截图_20240809180154.png

三、启动界面

gradio界面:(推荐)

python app_sadtalker.py

Linux/Mac OS:

bash webui.sh

微信截图_20240814164155.png

1.报错解决

当下载出现“tb-nightly”报错,使用下列命令:

pip install tb-nightly -i https://mirrors.aliyun.com/pypi/simple

下载完成后再重新安装requirements

pip install -r requirements.txt

微信截图_20240809171240.png

微信截图_20240809172050.png

微信截图_20240809172101.png


http://www.kler.cn/a/320594.html

相关文章:

  • <2025 网络安全>《网络安全政策法规-关键信息基础设施安全保护条例》
  • OceanBase 3.X 高可用 (一)
  • Git - 初识版本库
  • ubuntu20.04安装cudnn
  • SpringBoot之登录校验关于JWT、Filter、interceptor、异常处理的使用
  • html中为div添加展开与收起功能2(div隐藏与显示)
  • OpenCV特征检测(1)检测图像中的线段的类LineSegmentDe()的使用
  • 平稳随机信号
  • MySQL的登录、访问、退出
  • Apache Iceberg构建高性能数据湖
  • 【node】 cnpm|npm查看、修改镜像地址操作 换源操作
  • Python的Pandas库学习指南
  • C++学习笔记----8、掌握类与对象(一)---- 对象中的动态内存分配(1)
  • Spring Boot使用配置方式整合MyBatis
  • 【Hadoop】一、Hadoop入门:基础配置、集群配置、常用脚本
  • 记录docker phpadmin 链接 docker mysql
  • MQTT客户端实战:从连接到通信。详细说明MQTT客户端和MQTT代理进行通信
  • 微服务Docker相关指令
  • 使用python搭建Web项目
  • swiper3匀速滚动会卡顿问题,已解决
  • Linux线程同步—竞态条件与互斥锁、读写锁(C语言)