当前位置：首页 > article >正文

audiocraft - 免费文本转音乐、AI音乐生成、AI音乐创作工具，Facebook开源，本地一键整合包下载

article 2024/9/20 9:32:10

read-normal-img

AudioCraft 是一个由Facebook Research开发的PyTorch库，专注于深度学习在音频生成领域的研究。这个强大的工具包集成了两个最新的AI音频生成模型：AudioGen和MusicGen，能够产生高质量的声音和音乐。

今天的一键包也包含了 AudioGen 和 MusicGen 两个部分，主要演示MusicGen，因为MusicGen的模型基本支持了AudioGen的所有功能。

之前也发过过类似的工具，比如 Stable Audio Tools ，同样，audiocraft不仅可以生成各种模拟音频效果，还能减少音损。用户使用该AI工具，只需要在输入文本内容后，即可生成高质量、逼真的音频和音乐。

AudioCraft 使用了两万小时的授权音乐来训练 MusicGen。具体来说，依赖于 10K 高质量音乐曲目的内部数据集，以及 ShutterStock 和 Pond5 音乐数据。

最后，最重要的一点，AudioCraft生成的音乐是可以用于商业用途的，不用担心版权纠纷。

一键包下载：私信 " AI音乐 "

应用场景

音乐创作：使用MusicGen，你可以根据简单的文本指令创造出独一无二的音乐作品。

语音合成：AudioGen可以将文本转化为自然流畅的声音，适用于有声读物或语音助手等领域。

音频压缩与解码：EnCodec提供高效高质的音频编码与解码方案，可用于音频传输和存储优化。

版权保护：AudioSeal的水印技术可对音频内容进行安全标记，防止未经授权的使用

使用教程：

输入提示词，也可手动上传参考音频文件

read-normal-img

官方程序提供了10 个预训练模型。

着重介绍以下几个模型：

facebook/musicgen-small ： 300M 型号，仅文本到音乐

facebook/musicgen-medium ：1.5B 型号，仅文本到音乐

facebook/musicgen-melody ： 1.5B 型号，文本转音乐和文本+旋律转音乐

facebook/musicgen-large ： 3.3B 型号，仅文本到音乐

facebook/musicgen-melody-large ： 3.3B 模型，文本到音乐和文本 + 旋律到音乐

facebook/musicgen-stereo-melody-large ：所有以前的型号都针对立体声生成进行了微调 - 小、中、大、旋律、旋律大

如果你的显卡较好，显存12G起，推荐facebook/musicgen-stereo-melody和facebook/musicgen-stereo-melody-large这两个模型，生成的效果是最好的。

如果你的显卡一般，比如8G显存起，可以用 facebook/musicgen-small和facebook/musicgen-medium。

官方推荐 facebook/musicgen-stereo-melody 这个模型，综合能力最好。

考虑到一键包大小，一键包只内置了 facebook/musicgen-stereo-melody 这个模型，如果需要体验其他模型，只需要切换到任意模型，提交的时候后台会自动下载。

也可以单独下载网盘提供的模型包，下载后拷贝到软件根目录下，右键解压到当前文件夹即可。

模型选择好后，选择解码器，设置生成时长，剩下的参数可以默认

read-normal-img

最后点击生成即可。

查看全文

http://www.kler.cn/news/285211.html

Redisson 实现分布式锁

类和对象（4）

zabbix对接Grafana

Linux的远程登录教程（超详细）

排序算法之桶排序详细解读（附带Java代码解读）

模型错位竞争（战略规划）

从Vuex 到 Pinia，Vue 状态管理的进化

HTB-sequal(mysql)

十一. 常用类

如何开发针对不平衡分类的成本敏感神经网络 python

遇到“Interpreter parsed an intent ‘xxx‘ which is not defined in the domain“报错

贵州大数据实验室建设案例分享

vue调用booststrap弹窗

大数据-112 Flink DataStreamAPI 程序输入源 DataSource 基于文件、集合、Kafka连接器

Linux随记（十一）

android 14及android15 READ_EXTERNAL_STORAGE跟相册，视频权限的适配

GraphRAG 文本分割优化

深度学习100问31:如何降低语言模型的困惑度

yolov8旋转目标检测部署教程（附代码c++_python）

在Java中，获取输入内容可以通过多种方式实现，以下是三种常用的方式：Scanner、BufferedReader 和 Console 的具体代码示例

chromedriver下载地址

c# net8调用vc写的dll

机械学习—零基础学习日志（如何理解概率论10）

学习记录：js算法（二十）：子数组最大平均数 I、无重复字符的最长子串

Linux(文件的查找和解压缩)

RelativeLayout相对布局

使用 UniApp 实现摄像头视频流的接入并在页面上显示视频流

NC115.栈和排序_C++题解

python-word添加标题，段落，文字块

Web开发 Ajax 2024/3/31

相关文章：