使用GPT-SoVITS训练语音模型
1.项目演示
阅读单句话
1725352713141
读古诗
1725353700203
2.项目环境
开发环境:linux
机器配置如下:实际使用率百分之二十几,
3.开发步骤
1.首先是准备数据集,要求是wav格式,一到两个小时即可,
2.配置GPT-SoVITS需要的环境,
这里要注意,如果是windows直接下载整合包,linux用户则需要先把项目克隆到本地,然后再将模型下载下来放进去,才能继续成功运行。
整合包及模型下载链接 (yuque.com)
Linux的步骤在下面,
2.1 克隆项目
进入项目地址,点击code,再点击复制按钮将链接复制下来。
之后到自己的服务器里去,执行即可,(ps:可以先创建一个文件夹,git初始化这些老生常谈的事情,再放进去。不过我们的主要目的是用而不是修改。)
git clone https://github.com/RVC-Boss/GPT-SoVITS.git
github项目链接如下:
RVC-Boss/GPT-SoVITS: 1 min voice data can also be used to train a good TTS model! (few shot voice cloning) (github.com)
2.2 安装运行所需的库
进入服务器,创建虚拟环境
2.3 将下载好的模型放入对应的位置