当前位置: 首页 > article >正文

高效语言模型 Parler-TTS 上线,一键完成文本转语音

Parler-TTS 是一种轻量级的文本转语音 (TTS) 模型,可以生成具有给定说话者风格的高质量、自然语音,自由度及创新性非常高,并且可以通过 Prompt 控制说话者的性别、音色、语调以及所处的场景(室内、室外、马路上、音乐厅等)。
使用云平台:OpenBayes
http://openbayes.com/console/signup?r=sony_0m6v
登录到 OpenBayes 平台后,打开「公共教程」,找到「一键部署 Parler-TTS」的教程。


进入到教程界面后,点击右上角「克隆」。


平台在克隆过程中已自动为我们配置好了模型文件,点击「下一步:选择算力」。


平台会自动选择合适的算力资源和镜像版本,这里使用的是英伟达 RTX 4090 的算力和 PyTorch 的镜像,根据需求选择「按量付费」或者「包日/周/月」,点击「审核并执行」。可以使用文章开头的邀请链接,获得 RTX 4090 使用时长!


确认模型信息无误后,点击「继续执行」。


稍等片刻,待系统分配好资源,状态栏显示为「运行中」后,将鼠标悬停在 API 地址处,点击链接进入模型。进入 API 地址需要先进行实名认证~


进入模型后,我们可以在「Input Text」中输入我们要生成的文本,比如我们输入(All of the data, pre-processing, training code, and weights are released publicly under a permissive license, enabling the community to build on our work and develop their own powerful models.);「Description」中描述语音的风格,我们输入(Laura's voice is monotone yet slightly fast in delivery, with a very close recording that almost has no background noise.);Demo 默认使用的是 Mini 模型,可以勾选「Use Large checkpoint」选择更大的模型。最后点击「Generate Audio」生成。


http://www.kler.cn/a/401745.html

相关文章:

  • 基于Java Springboot甘肃旅游管理系统
  • 【会话文本nlp】对话文本解析库pyconverse使用教程版本报错、模型下载等问题解决超参数调试
  • 鸿蒙HarmonyOS 地图定位到当前位置 site查询等操作
  • css uniapp背景图宽度固定高度自适应可以重复
  • k-近邻算法(K-Nearest Neighbors, KNN)详解:机器学习中的经典算法
  • 远程jupyter lab的配置
  • Mybatis框架之单例模式 (Singleton Pattern)
  • 微服务day09
  • 使用Python语言编写一个简单的网页爬虫,用于抓取网站上的图片并保存到本地。
  • 同步接口和异步接口-------每日一问
  • SSL/TLS协议简介
  • 跟着Nature Genetics学习如何回复审稿人(1)
  • 基本数据类型:Kotlin、Dart (Flutter)、Java 和 C++ 的比较
  • C# MethodTimer.Fody 使用详解
  • ubuntu固定ip
  • AI图片分析接口LiteAIServer摄像机实时接入分析平台车辆检测算法
  • 从源头保障电力安全:输电线路动态增容与温度监测技术详解
  • Linux第93步_Linux内核的LED灯驱动
  • 甲骨文云服务器 (Oracle Cloud) 终极防封、防回收的教程!
  • 【鸿蒙开发】第十三章 ArkTS基础类库-容器(数据结构)
  • 用pandoc工具实现ipynb,md,word,pdf之间的转化
  • Vue3 -- 搭建项目路由【vue-router!!!】
  • Qt 文件管理
  • 网络编程-002-UDP通信
  • vscode使用ssh配置docker容器环境
  • Unity类银河战士恶魔城学习总结(P128 Switch UI with KeyBoard用键盘切换UI)