当前位置: 首页 > article >正文

ai翻唱部分步骤

模型部署

我是用的RVC进行的训练,也可以使用so-vits-svc。

通过百度网盘分享的文件:RVC-beta
链接:https://pan.baidu.com/s/1c99jR2fLChoqUFqf9gLUzg 
提取码:4090 
 

以Nvida显卡为例,分别下载“RVC1006Nvidia”和“0128补丁”压缩包,分别解压后,复制“0128补丁”内容粘贴到“RVC1006Nvidia”文件夹进行替换  之后,直接点击go-web.bat运行即可。

  需要电脑安装好CUDA,安装步骤可以看这个链接:最详细!Windows下的CUDA与cuDNN详细安装教程_cuda安装-CSDN博客

收集素材

从b站下载音视频制作

使用DownKyi

通过百度网盘分享的文件:DownKyi
链接:https://pan.baidu.com/s/1pDGbFYYw6HIRuPB41U5Hgw 
提取码:4090 
 

数据集制作

1.将文件转换为wav类型

2.

将音频文件拖到上图红框内,然后点击模型选择HP3,点击转换;

转换后的结果再次放入上图红框内,点击模型选择onnx_dereverb,点击转换;

也可继续进行别的处理。

训练

1. 输入实验名(自拟),然后选择音频目标采样率(一般为40k),其他保持默认 ,点击“处理数据”即可。(此步骤是将音频剪切成数个短节,“输出信息”栏会提示进程结束)

2.根据自身情况选择音高提取算法(输入歌声可用pm提速,高质量语音但CPU差可用dio提速,harvest质量更好但慢,rmvpe效果最好且微吃CPU/GPU),之后点击“特征提取”(“输出信息”栏会提示进程结束)

3.根据自身显卡性能选择“保存频率”、“总训练轮数”和“每张显卡的batch_size”(显卡不太行的建议设置低一点),其他保持默认,依次点击“训练模型”“训练特征索引”和“一键训练”(“输出信息”栏会提示进程结束)

Ai翻唱之模型推理

1. 切换到“模型推理”界面,在“推理音色”上选择上面步骤一训练好的模型权重文件;

2. 输入待处理音频文件路径,即需要模拟的声音或歌曲文件所在的路径。

3. 输入索引index路径。

4.根据下图说明进行适当调整,即可点击“转换”开始模型推理。

(待处理音频为目标转换音频)


http://www.kler.cn/a/380925.html

相关文章:

  • 使用WebStorm开发Vue3项目
  • Python基于TensorFlow实现双向循环神经网络GRU加注意力机制分类模型(BiGRU-Attention分类算法)项目实战
  • Spring框架---AOP技术
  • Segmentation fault 问题解决
  • GPT-SoVITS 部署方案
  • 内网远程连接解决方案【Frp】
  • 3.5 windows xp ReactOS EiAllocatePool()
  • HarmonyOS 移动应用开发
  • C++学习笔记----10、模块、头文件及各种主题(一)---- 模块(4)
  • MFCC特征与Fbank特征在语音识别中的应用
  • Unity3D PCG地图的使用与优化详解
  • npm入门教程2:npm历史
  • AI 写作(一):开启创作新纪元(1/10)
  • Qt 文件目录操作
  • Linux 进程终止 进程等待
  • linux同步执行命令脚本 (xcall)
  • ubuntu工具 -- ubuntu服务器临时没有网络,急需联网下载东西怎么办? 使用手机提供网络
  • AI打造超写实虚拟人物:是科技奇迹还是伦理挑战?
  • 【Python爬虫实战】深入 Selenium:从节点信息提取到检测绕过的全攻略
  • 基于C语言实现的TCP客户端
  • 哈希表相关知识
  • 解决wsl重启后debian配置vm.max_map_count不生效问题以及设置docker开机自启
  • Kafka在大数据处理中的作用及其工作原理
  • 20.04Ubuntu配置opencv并使用头文件
  • CSS--综合练习
  • 商业数据库 - oracle -数据字典