当前位置：首页 > article >正文

如何在算家云搭建GPT-SOVITS（语音转换）

article 2024/10/26 3:51:36

一、模型介绍

GPT-SOVITS是一款强大的小样本语音转换和文本转语音 WebUI工具。它集成了声音伴奏分离、自动训练集分割、中文ASR和文本标注等辅助工具。

具有以下特征：

零样本 TTS：输入 5 秒的声音样本并体验即时文本到语音的转换。
少量样本 TTS：仅使用 1 分钟的训练数据对模型进行微调，以提高语音相似度和真实感。
跨语言支持：使用不同于训练数据集的语言进行推理，目前支持英语、日语、韩语、粤语和中文。
WebUI 工具：集成工具包括语音伴奏分离、自动训练集分割、中文 ASR 和文本标注，帮助初学者创建训练数据集和 GPT/SoVITS 模型。

二、模型搭建流程

环境测试

模型已在 RTX 3090，CUDA12.2 上测试完成

1. 创建容器实例

进入算家云的“应用社区”，点击搜索找到"GPT-SOVITS"，点击“创建应用”，即可进入容器平台

点击进入之后会自动匹配模型，选择显卡，点击“立即创建”即可创建实例

也可以点击”专业创建“，自主选择 GPU 型号、计费方式等配置

2. 进入创建的实例

实例创建成功之后，点击“项目实例”再点击“WebShell”开启终端（小黑屏）

3. 终端操作

进入命令操作页后，输入或者复制粘贴一下命令

cd /GPT-SoVITS/
conda activate GPTSoVits
python webui.py

[注]本模型需用隧道工具开多端口，如下图：

此时的访问地址（http://127.0.0.1：端口号）为

http://127.0.0.1：8080

http://127.0.0.1：9873

4. Web页面演示

以上就是在算家云搭建 GPT-SOVITS 的流程，具体使用方式可进入算家云应用社区查看该模型的使用说明。

点击算家云-应用社区，选择模型，一键开启 AI 之旅！

查看全文

http://www.kler.cn/news/365319.html

Spring Cloud微服务：构建现代应用的新基石

基于vue框架的的高校消防设施管理系统06y99（程序+源码+数据库+调试部署+开发环境）系统界面在最后面。

艾默生Ovation伺服驱动器电子模块（1C31199G03）

开源限流组件分析（三）：golang-time/rate

数据结构：堆的应用

三款计算服务器配置→如何选择科学计算服务器？

redis5.0 cluster一个机器维修迁移到另外一个机器

合合信息亮相PRCV大会，探讨生成式AI时代的内容安全与系统构建加速

超越OpenAI GPT-4o，Yi-Lightning指南：中国AI大模型新巅峰

Ubuntu 20.04上安装Docker-CE社区版

使用 rbenv 安装 Ruby 2.7.5

华为HCIE-OpenEuler认证详解

快速创建一个微信小程序，详细步骤以及示范程序代码

python项目实战——多线程爬虫

java如何部署web后端服务

Vue3 学习笔记（五）Vue3 模板语法详解

【揭秘】图像算法工程师岗位如何进入？

Java：数据结构-二叉树

pta-java-6-1 jmu-Java-04面向对象进阶-01-接口-匿名内部类ActionListener

SpringBoot实现mysql多数据源配置(Springboot+Mybatis)

模拟信号采集显示器+GPS同步信号发生器制作全过程（焊接、问题、代码、电路）

Java调用大模型 - Spring AI 初体验

[ 钓鱼实战系列-基础篇-8 ] 一篇文章教会你选择适合的钓鱼项目并设计钓鱼页面

富格林：曝光阻止欺诈套路攻略

利用移动式三维扫描技术创建考古文物的彩色纹理网格【上海沪敖3D】

Java基础第二天（实训学习整理资料（二））