当前位置: 首页 > article >正文

如何在算家云搭建MVSEP-MDX23(音频分离)

一、MVSEP-MDX23简介

模型GitHub网址:MVSEP-MDX23-music-separation-model/README.md 在 main ·ZFTurbo/MVSEP-MDX23-音乐分离模型 ·GitHub 上

在音视频领域,把已经发布的混音歌曲或者音频文件逆向分离一直是世界性的课题。音波混合的物理特性导致在没有原始工程文件的情况下,将其还原和分离是一件很有难度的事情。MVSEP-MDX23音乐分离模型是基于 Demucs4、MDX 神经网络架构和 Ultimate Vocal Remover 项目中的一些 MDX 权重。该模型在MultiSong 数据集上执行的最佳分离模型进行质量比较,发现该模型在SDR(信噪比)中比Demucs HT 4、Demucs 3、MDX B模型效果好。该模型有图形用户界面,web界面,本容器主要运用web界面,如下图所示:

m1.png

将对上传的音频文件进行声音分离及显示频谱信息,分为人声、仪器、器乐、低音、鼓、其他六部分,以及相应的频谱图:

image.png

二、模型搭建流程

1.容器镜像一键使用

在“租用实例”页面进入应用社区,选择MVSEP-MDX23

1727071404530_image.png

image.png

(2)选择3090或其他性能优于3090的显卡,点击“立即创建”

image.png

2.进入创建的实例

在“项目实例”页面点击对应实例的“Web SSH”操作

3060.jpg

image.png

以下命令均在该页面进行:

· 打开项目文件所在位置

cd MVSEP-MDX23-music-separation-model

· 激活ck虚拟环境

conda activate ck

· 更新gradio

pip install --upgrade gradio

· 指定端口即可启动项目,启动命令如下:

export GRADIO_SERVER_NAME=0.0.0.0
export GRADIO_SERVER_PORT=8080
python web-ui.py

出现以下页面代表运行成功:

image.png

3.开启外部访问获取访问链接

返回“项目实例”列表,选择并点击对应实例的“开放端口”操作。

image.png

有两种访问方式可以选择:本地私密访问和对外开放端口

(1)本地私密访问:选择 ssh 工具访问,登录之后填写各选项,点击“开启代理”

image.png

(2)对外开放端口:请按照下图操作

image.png

4.进入 webUI 界面后即可操作

将复制的访问网址粘贴到新网页即可开始 ui 界面的使用。注意:上传音频时长过长,处理过程容易报错,需要修剪到8秒左右。另外需要勾选“使用单个ONNX”才能运行成功

image.png

以上就是在算家云搭建 MVSEP-MDX23 的流程,具体使用方式可进入算家云应用社区查看该模型的使用说明。

点击容器中心 算家云,选择模型,一键开启 AI 之旅!

971a4f51b8f1c01ea3fc332bef04cbf.png


http://www.kler.cn/news/327968.html

相关文章:

  • 深度学习500问——Chapter17:模型压缩及移动端部署(2)
  • ubuntu安装ftp服务器
  • 前端Vue.js与后端Flask/Django协同开发指南
  • Java面试题真题·人才招聘系统项目介绍
  • 【Java 集合】List接口 —— ArrayList 与 LinkedList 详解
  • 针对考研的C语言学习(定制化快速掌握重点2)
  • 深度解析 HTTP
  • Linux集群部署RabbitMQ
  • 从Linux系统的角度看待文件-基础IO
  • Linux服务器配置anaconda3,下载torch
  • Brave编译指南2024 MacOS篇-拉取源码前的准备工作(二)
  • 鸿蒙开发(NEXT/API 12)【硬件(外设扩展驱动开发)】驱动开发服务
  • 【算法】模拟:(leetcode)6.Z 字形变换(medium)
  • 数据预处理:数据挖掘的第一步
  • 基于STM32的智能门禁系统
  • OpenCV视频I/O(6)检查视频捕获对象是否已成功打开的函数isOpened()的使用
  • uniapp 微信小程序 微信支付
  • 张量、框架
  • 选择与运用合适工具提升编程效率的秘诀
  • uboot笔记(一):概括/移植等
  • Lagent 自定义你的 Agent 智能体
  • k8s 部署 prometheus
  • Android中级控件
  • Fivetran+Milvus:AI搜索新时代的数据迁移利器
  • 学习记录:js算法(五十):二叉树的右视图
  • 【Preference Learning】Reasoning with Language Model is Planning with World Model
  • mysql学习教程,从入门到精通,SQL 表、列别名(Aliases)(30)
  • Spring Boot框架在甘肃非遗文化网站设计中的运用
  • ubuntu配置python环境
  • 深度学习基础及技巧