当前位置: 首页 > article >正文

语音合成(自然、非自然)

1.环境

Python 3.10.14

2.完成代码

2.1简陋版


import pyttsx3



# 初始化tts引擎
engine = pyttsx3.init()

# 设置语音速度
rate = engine.getProperty('rate')
engine.setProperty('rate', rate - 50)

# 设置语音音量
volume = engine.getProperty('volume')
engine.setProperty('volume', volume + 0.5)

if __name__ == '__main__':

    engine.say("我的包子很好吃,你想吃吗")
    engine.runAndWait()
    engine.stop()

2.2惊艳版(目前仅支持在Linux操作系统上使用,暂不支持Windows及Mac使用)

text = '待合成文本'
model_id = 'damo/speech_sambert-hifigan_tts_zh-cn_16k'
sambert_hifigan_tts = pipeline(task=Tasks.text_to_speech, model=model_id)
output = sambert_hifigan_tts(input=text, voice='zhitian_emo')
wav = output[OutputKeys.OUTPUT_WAV]
with open('output.wav', 'wb') as f:
    f.write(wav)

3.效果

传不了语音,语音效果还是蛮不错的
在这里插入图片描述

4.问题

1.在Linux上运行的效果很好,普通的能跑的版本效果不行
2.模型可去模型资源网站搜索下载(也可私信)


http://www.kler.cn/a/318081.html

相关文章:

  • 面试题整理12----K8s中Pod创建常见错误
  • 基于BiTCN双向时间卷积网络实现电力负荷多元时序预测(PyTorch版)
  • python递归最多多少层
  • 【c语言】简单的c程序设计
  • xterm遇到的问题及解决方案
  • C程序设计:数据在数组中的交换
  • Maven中依赖配置
  • WRFDA保姆级安装教程
  • 聊一下cookie,session,token的区别
  • linux-下载、安装、更新和管理软件包
  • 【C++掌中宝】走进C++引用的世界:从基础到应用
  • leveldb前缀匹配查找Seek
  • SWC(Speedy Web Compiler)
  • java算法OJ(1)位运算
  • LabVIEW闪退
  • 企业职工薪资查询系统小程序的设计
  • JVM —— 类加载器的分类,双亲委派机制
  • 6 门新兴语言,小众亦强大
  • SpringCloud 基于 web 的只会养老平台
  • 【30天玩转python】高级面向对象编程
  • MYSQL解说
  • Flexus X实例全方位指南:智能迁移、跨云搬迁加速与虚机热变配能力的最佳实践
  • Linux——创建编写并编译一个C程序
  • 前端项目代码开发规范及工具配置
  • 【Linux】深度解析与实战应用:GCC/G++编译器入门指南
  • 无人机视角下的车辆数据集