当前位置: 首页 > article >正文

GPT-SoVITS语音合成模型部署及使用

1、概述

GPT-SoVITS是一款开源的语音合成模型,结合了深度学习和声学技术,能够实现高质量的语音生成。其独特之处在于支持使用参考音频进行零样本语音合成,即使没有直接的训练数据,模型仍能生成相似风格的语音。用户可以通过微调模型,进一步提升其性能,以适应特定的应用需求。

2、部署

(1)下载

项目地址:https://github.com/RVC-Boss/GPT-SoVITS

教程:GPT-SoVITS指南 · 语雀

试用demo:https://gsv.acgnai.top/

(2)依赖环境安装

1)安装conda,用于部署独立的python环境

2)新建conda环境,然后安装python3.9 / pytorch2.2.1

python需要安装cuda版本:https://pytorch.ac.cn/get-started/locally/

使用得到的conda命令进行安装。

3)安装ffmpeg

具体参考:Linux-centos下安装ffmpeg的详细(保姆级教程)教程无脑复制粘贴等待即可_linux centos 安装ffmpeg-CSDN博客

4)安装git

yum install git

yum install git-lfs

yum install rust

下载代码:git clone --depth=1 https://github.com/RVC-Boss/GPT-SoVITS

5)安装python依赖包

在GPT-SoVITS根目录下:

pip install -i https://pypi.tuna.tsinghua.edu.cn/simple -r requirements.txt

(3)下载预训练模型

针对报错:

模型位于:https://huggingface.co/lj1995/GPT-SoVITS/tree/main

下载后放到GPT_SoVITS根目录/GPT_SoVITS/pretrained_models下,而不是GPT_SoVITS根目录/pretrained_models

目录结构如下:

(4)下载训练模型

cd xx/GPT-SoVITS/tools/asr/models

git lfs install 

git clone https://www.modelscope.cn/iic/speech_paraformer-large_asr_nat-zh-cn-16k-common-vocab8404-pytorch.git

git clone https://www.modelscope.cn/iic/punc_ct-transformer_zh-cn-common-vocab272727-pytorch.git

git clone https://www.modelscope.cn/iic/speech_fsmn_vad_zh-cn-16k-common-pytorch.git

3、程序运行

(1)推理操作

在GPT-SoVITS根目录下运行命令:

python webui.py zh_CN

切换到1C-推理模块:

点击“开启TTS推理WebUI”

后台执行日志如下:

"/data/work/anaconda3/envs/vits/bin/python" GPT_SoVITS/inference_webui.py "zh_CN"
<All keys matched successfully>
Number of parameter: 77.61M
Running on local URL:  http://0.0.0.0:9872
 

切换成9872端口:

然后上传3-10秒的参考音频(不上传会报错),填写需要合成的文本,点击“合成语音”。

后台执行日志参考如下:

(2)报错处理

ps:假如运行时报错如下,这是预训练模型没有下载,或者存放的位置不正确。

虽然程序可以打开了,但是linux服务器上报错如下,显示预训练模型没有加载。这样虽然界面打开了,但是功能将无法正常使用。

本文参考:GPT-SoVITS语音合成模型实践 - 哥不是小萝莉 - 博客园


http://www.kler.cn/a/443210.html

相关文章:

  • Transformer入门教程全解析(一)
  • C# 对象和类型(结构)
  • 无网络时自动切换备用网络环境
  • halcon三维点云数据处理(七)find_shape_model_3d_recompute_score
  • JVM 优化指南
  • 【2024华为OD-E卷-100分-boss的收入】(题目+思路+JavaC++Python解析)
  • 从零开始,一步一步搭建Typescript+React+Redux项目——集成react-router和axios(三)
  • socket编程UDP-实现停等机制(接收确认、超时重传)
  • 第二部分:进阶主题 15 . 安全管理 --[MySQL轻松入门教程]
  • “TA”说|表数据备份还原:SQLark 百灵连接助力项目部署验收
  • SQL中表相关的操作
  • 增材制造(3D打印):原理、类型、领域、优势、瓶颈、方向
  • Oracle JDK需登录下载解决
  • [Unity]Unity跨平台开发之针对Android开发
  • Nmap初步学习
  • React中定义和使用类式组件
  • nano编辑器的使用
  • 4.metagpt中的软件公司智能体 (ProjectManager 角色)
  • CSS Backgrounds(背景)
  • 干掉运动模糊!Deblur4DGS:清晰的高质量视频动态重建
  • Mongodb 启用认证
  • 图变换器的再思考:谱注意力网络
  • Oracle Database 21c Express Edition数据库 和 Sqlplus客户端安装配置
  • Unity类银河战士恶魔城学习总结(P178 Archer s arrow 弓箭手的箭)
  • 从Windows到Linux:跨平台数据库备份与还原
  • 利用Java爬虫获得京东JD商品SKU信息