当前位置: 首页 > article >正文

语音合成(自然、非自然)

1.环境

Python 3.10.14

2.完成代码

2.1简陋版


import pyttsx3



# 初始化tts引擎
engine = pyttsx3.init()

# 设置语音速度
rate = engine.getProperty('rate')
engine.setProperty('rate', rate - 50)

# 设置语音音量
volume = engine.getProperty('volume')
engine.setProperty('volume', volume + 0.5)

if __name__ == '__main__':

    engine.say("我的包子很好吃,你想吃吗")
    engine.runAndWait()
    engine.stop()

2.2惊艳版(目前仅支持在Linux操作系统上使用,暂不支持Windows及Mac使用)

text = '待合成文本'
model_id = 'damo/speech_sambert-hifigan_tts_zh-cn_16k'
sambert_hifigan_tts = pipeline(task=Tasks.text_to_speech, model=model_id)
output = sambert_hifigan_tts(input=text, voice='zhitian_emo')
wav = output[OutputKeys.OUTPUT_WAV]
with open('output.wav', 'wb') as f:
    f.write(wav)

3.效果

传不了语音,语音效果还是蛮不错的
在这里插入图片描述

4.问题

1.在Linux上运行的效果很好,普通的能跑的版本效果不行
2.模型可去模型资源网站搜索下载(也可私信)


http://www.kler.cn/news/318081.html

相关文章:

  • Maven中依赖配置
  • WRFDA保姆级安装教程
  • 聊一下cookie,session,token的区别
  • linux-下载、安装、更新和管理软件包
  • 【C++掌中宝】走进C++引用的世界:从基础到应用
  • leveldb前缀匹配查找Seek
  • SWC(Speedy Web Compiler)
  • java算法OJ(1)位运算
  • LabVIEW闪退
  • 企业职工薪资查询系统小程序的设计
  • JVM —— 类加载器的分类,双亲委派机制
  • 6 门新兴语言,小众亦强大
  • SpringCloud 基于 web 的只会养老平台
  • 【30天玩转python】高级面向对象编程
  • MYSQL解说
  • Flexus X实例全方位指南:智能迁移、跨云搬迁加速与虚机热变配能力的最佳实践
  • Linux——创建编写并编译一个C程序
  • 前端项目代码开发规范及工具配置
  • 【Linux】深度解析与实战应用:GCC/G++编译器入门指南
  • 无人机视角下的车辆数据集
  • 18.1 k8s服务组件之4大黄金指标讲解
  • 高等数学的后续课程
  • [大语言模型] LINFUSION:1个GPU,1分钟,16K图像
  • 个人量化成功之路-----获取实时OHLC的数据
  • 设计模式六大原则:面向对象设计的核心
  • 不靠学历,不拼年资,怎么才能月入2W?
  • 电商安全新挑战:筑起数字防御长城,守护业务与数据安全
  • Java反射机制入门:解锁运行时类信息的秘密
  • 新闻文本分类识别系统Python+卷积神经网络算法+人工智能+深度学习+计算机毕设项目+TensorFlow+Django网页界面
  • 面经3——中和农信