当前位置: 首页 > article >正文

Audiocraft智能音频和音乐生成工具部署及使用

1、概述

Facebook开源了一款名为AudioCraft的AI音频和音乐生成工具。

该工具可以直接从文本描述和参考音乐生成高质量的音频和音乐。AudioCraft包含MusicGen、AudioGen和EnCodec三个模型,分别实现音乐生成、音频生成和自定义音频模型构建。

2、项目地址

https://github.com/facebookresearch/audiocraft.git

3、部署流程

(1)使用conda创建python环境

conda create -n audiocraft python==3.9

(2)下载代码ECS中

(3)配置环境

进入audiocraft根目录,依次执行:

安装torch2.1.0版本
python -m pip install 'torch==2.1.0'

安装setuptools wheel 
python -m pip install setuptools wheel

安装Audiocraft 包
python -m pip install -U audiocraft  

在 Python 中从当前目录安装一个包的“可编辑”(editable)模式。 
python -m pip install -e .

安装当前目录下的 Python 包,并以可编辑模式安装,同时包括名为 wm的额外功能。
python -m pip install -e '.[wm]'

 安装ffmpeg

conda install "ffmpeg<5" -c conda-forge

安装主要的依赖包

pip install -r requirements.txt

(4)修改audiocraft配置文件

进入/audiocraft/demos文件夹

cd demos

编辑musicgen_app.py中的listen和server_port参数 

vim musicgen_app.py

在右下角显示的482行,的--listen下的default修改成default='0.0.0.0',494行的--server_port下的default修改成自己的业务端口,修改好后直接输入:wq 即可  

4、运行Audiocraft

运行命令:

python musicgen_app.py

注意:prompts中填入音乐相关的参数,不要描绘画面(那是给SD用的)

后台执行日志见:

可以看到首次执行时会下载相关的模型。

5、报错处理

错误解决参考文档:解决libcusparse.so.12: undefined symbol: __nvJitLinkAddData_12_1, version libnvJitLink.so.12-CSDN博客


http://www.kler.cn/a/447059.html

相关文章:

  • Qwen文章阅读笔记
  • 0基础学前端-----CSS DAY9
  • 让汉语和英语一样长的字符编码
  • LabVIEW深海气密采水器测控系统
  • jmeter 接口性能测试 学习笔记
  • W25Q128读写实验(一)
  • C# OpenCV机器视觉:图像平滑
  • STM32HAL I2C函数
  • STM32裸机系统采用滴答定时器延时
  • Ubuntu安装及删除httpd(Apache)
  • 初识面向对象晨考day09
  • ISP算法之黑电平BLC校正
  • 重拾设计模式--备忘录模式
  • 半连接转内连接 | OceanBase SQL 查询改写
  • Ps:屏幕模式
  • Python3.9的安装和配置
  • C# OpenCV机器视觉:尺寸测量
  • leecode474.一和零
  • 社会工程-交流模型
  • python如何获取excel单元格文字是否加粗
  • ParrotOS,一个与kali类似的渗透测试操作系统
  • 你的第一个博客-第一弹
  • 开源轮子 - Hutool
  • 解析大模型常用微调方法:P-Tuning、Prefix Tuning、Adapter、LoRA
  • 融合机器学习算法:用VotingClassifier实现分类多模型的投票集成
  • ResNext-50模型进行图像识别