当前位置: 首页 > article >正文

如何在算家云搭建GPT-SOVITS(语音转换)

一、模型介绍

GPT-SOVITS是一款强大的小样本语音转换和文本转语音 WebUI工具。它集成了声音伴奏分离、自动训练集分割、中文ASR和文本标注等辅助工具。

具有以下特征:

  • 零样本 TTS: 输入 5 秒的声音样本并体验即时文本到语音的转换。
  • 少量样本 TTS: 仅使用 1 分钟的训练数据对模型进行微调,以提高语音相似度和真实感。
  • 跨语言支持:使用不同于训练数据集的语言进行推理,目前支持英语、日语、韩语、粤语和中文。
  • WebUI 工具: 集成工具包括语音伴奏分离、自动训练集分割、中文 ASR 和文本标注,帮助初学者创建训练数据集和 GPT/SoVITS 模型。

二、模型搭建流程

环境测试

模型已在 RTX 3090,CUDA12.2 上测试完成

1. 创建容器实例

  • 进入算家云的“应用社区”,点击搜索找到"GPT-SOVITS",点击“创建应用”,即可进入容器平台

image.png

image.png

  • 点击进入之后会自动匹配模型,选择显卡,点击“立即创建”即可创建实例

image.png

  • 也可以点击”专业创建“,自主选择 GPU 型号、计费方式等配置

image.png

2. 进入创建的实例

  • 实例创建成功之后,点击“项目实例”再点击“WebShell”开启终端(小黑屏)

image.png

3. 终端操作

  • 进入命令操作页后,输入或者复制粘贴一下命令
cd /GPT-SoVITS/
conda activate GPTSoVits
python webui.py

[注]本模型需用隧道工具开多端口,如下图:

image.png

image.png

此时的访问地址(http://127.0.0.1:端口号)为

http://127.0.0.1:8080

http://127.0.0.1:9873

4. Web页面演示

image.png

以上就是在算家云搭建 GPT-SOVITS 的流程,具体使用方式可进入算家云应用社区查看该模型的使用说明。

点击算家云-应用社区,选择模型,一键开启 AI 之旅!

971a4f51b8f1c01ea3fc332bef04cbf.png


http://www.kler.cn/news/365319.html

相关文章:

  • Spring Cloud微服务:构建现代应用的新基石
  • 基于vue框架的的高校消防设施管理系统06y99(程序+源码+数据库+调试部署+开发环境)系统界面在最后面。
  • 艾默生Ovation伺服驱动器电子模块(1C31199G03)
  • 开源限流组件分析(三):golang-time/rate
  • 数据结构:堆的应用
  • 三款计算服务器配置→如何选择科学计算服务器?
  • redis5.0 cluster一个机器维修迁移到另外一个机器
  • 合合信息亮相PRCV大会,探讨生成式AI时代的内容安全与系统构建加速
  • 超越OpenAI GPT-4o,Yi-Lightning指南:中国AI大模型新巅峰
  • Ubuntu 20.04上安装Docker-CE社区版
  • 使用 rbenv 安装 Ruby 2.7.5
  • 华为HCIE-OpenEuler认证详解
  • 快速创建一个微信小程序,详细步骤以及示范程序代码
  • python项目实战——多线程爬虫
  • java如何部署web后端服务
  • Vue3 学习笔记(五)Vue3 模板语法详解
  • 【揭秘】图像算法工程师岗位如何进入?
  • Java:数据结构-二叉树
  • pta-java-6-1 jmu-Java-04面向对象进阶-01-接口-匿名内部类ActionListener
  • SpringBoot实现mysql多数据源配置(Springboot+Mybatis)
  • 模拟信号采集显示器+GPS同步信号发生器制作全过程(焊接、问题、代码、电路)
  • Java调用大模型 - Spring AI 初体验
  • [ 钓鱼实战系列-基础篇-8 ] 一篇文章教会你选择适合的钓鱼项目并设计钓鱼页面
  • 富格林:曝光阻止欺诈套路攻略
  • 利用移动式三维扫描技术创建考古文物的彩色纹理网格【上海沪敖3D】
  • Java基础第二天(实训学习整理资料(二))