当前位置: 首页 > article >正文

【TTS】OuteTTS初体验

目录

一、环境

二、安装

1.安装outetts

2.测试脚本

3.遇到的问题

3.1 ckpt文件下载失败

3.2 OuteTTS-0.1-350M模型文件下载失败

3.3 驱动问题

3.4 play问题

4.最终脚本

总结


一、环境

操作系统:Red Hat Enterprise Linux release 8.8 (Ootpa)

python:python3.10.15

二、安装

1.安装outetts

pip install outetts

2.测试脚本

from outetts.v0_1.interface import InterfaceHF, InterfaceGGUF

# Initialize the interface with the Hugging Face model
interface = InterfaceHF("OuteAI/OuteTTS-0.1-350M")

# Or initialize the interface with a GGUF model
# interface = InterfaceGGUF("path/to/model.gguf")

# Generate TTS output
# Without a speaker reference, the model generates speech with random speaker characteristics
output = interface.generate(
    text="Hello, am I working?",
    temperature=0.1,
    repetition_penalty=1.1,
    max_length=4096
)

# Play the generated audio
output.play()

# Save the generated audio to a file
output.save("output.wav")

3.遇到的问题

3.1 ckpt文件下载失败

解决:通过此url下载,放到$HOME/.cache/outeai/tts/wavtokenizer_large_speech_75_token/路径下

https://huggingface.co/novateur/WavTokenizer-large-speech-75token/resolve/main/wavtokenizer_large_speech_320_24k.ckpt

3.2 OuteTTS-0.1-350M模型文件下载失败

解决:离线下载后,放到和脚本相同路径,修改脚本文件,执行时设置一下环境变量

export TRANSFORMERS_OFFLINE=1

export HF_DATASETS_OFFLINE=1

通过此url下载里面所有文件

https://huggingface.co/OuteAI/OuteTTS-0.1-350M/

├── OuteTTS-0.1-350M
│   ├── config.json
│   ├── generation_config.json
│   ├── gitattributes
│   ├── model.safetensors
│   ├── README.md
│   ├── special_tokens_map.json
│   ├── tokenizer_config.json
│   └── tokenizer.json
└── tts_exp.py

3.3 驱动问题

执行报错:OSError: PortAudio library not found 

解决:安装portaudio-devel

yum install portaudio-devel

3.4 play问题

执行报错:sounddevice.PortAudioError: Error querying device -1

解决:注释output.play()。

4.最终脚本

export TRANSFORMERS_OFFLINE=1

export HF_DATASETS_OFFLINE=1

python tts_exp.py

from outetts.v0_1.interface import InterfaceHF, InterfaceGGUF

# Initialize the interface with the Hugging Face model
# interface = InterfaceHF("OuteAI/OuteTTS-0.1-350M")
interface = InterfaceHF("./OuteTTS-0.1-350M")

# Or initialize the interface with a GGUF model
# interface = InterfaceGGUF("/data/tts/OuteTTS-0.1-350M-FP16.gguf")

# Generate TTS output
# Without a speaker reference, the model generates speech with random speaker characteristics
output = interface.generate(
    text="Hello, am I working?",
    temperature=0.1,
    repetition_penalty=1.1,
    max_length=4096
)

# Play the generated audio
# output.play()

# Save the generated audio to a file
output.save("output.wav")

总结

部署简单,不支持中文,让子弹飞一会。


http://www.kler.cn/a/402650.html

相关文章:

  • 美创科技入选2024数字政府解决方案提供商TOP100!
  • ROS2 报错记录
  • Windows系统运行库软件游戏修复工具
  • Vue.js 插槽 Slots 实际应用 最近重构项目的时候遇到的...
  • 机器人SLAM建图与自主导航:从基础到实践
  • 原生JS和CSS,HTML实现开屏弹窗
  • 企业微信中设置回调接口url以及验证 spring boot项目实现
  • 二叉树的练习题(下)
  • Python-简单病毒程序合集(一)
  • 《 C++ 点滴漫谈 一 》C++ 传奇:起源、演化与发展
  • 【大数据学习 | Spark】详解分区个数
  • Three.js 相机控制器Controls
  • Akts初识1.0
  • PuppyGraph:实时图查询引擎,无需ETL
  • 基于Java Springboot城市公交运营管理系统
  • 关于上架HarmonyOS元服务,ArkWeb问题
  • 题解 洛谷 Luogu P2440 木材加工 二分答案 C/C++
  • 有效的完全平方数
  • webgl threejs 云渲染(服务器渲染、后端渲染)解决方案
  • 达梦数据库工程师认证培训体系是怎么样的?
  • 【linux学习指南】VSCode部署Ubantu云服务器,与Xshell进行本地通信文件编写
  • maven仓库
  • 大数据技术Kafka详解:消息队列(Messages Queue)
  • 类和对象(1) —— 类和对象的概念、类的实例化和初始化、构造方法和this关键词
  • 海外带云仓多语言商城源码,多语言多商家云仓一键代发商城
  • Python学习29天