当前位置: 首页 > article >正文

人工智能之基于阿里云快速搭建语音合成

人工智能之基于阿里云快速搭建语音合成

需求描述

  1. 基于阿里云搭建语音合成模型,模型名称:iic/speech_sambert-hifigan_tts_zh-cn_16k
  2. 使用上述模型输入一段文字合成语音,模型路径

业务实现

阿里云配置

阿里云配置如下:
在这里插入图片描述

代码验证

from modelscope.outputs import OutputKeys
from modelscope.pipelines import pipeline
from modelscope.utils.constant import Tasks

text = '你好!我是一个人工智能助手,专门帮助用户回答问题、提供信息和解决问题。我可以回答各种主题,包括科学、技术、文学、历史等。\
        如果你有任何问题或者需要帮助的地方,请随时告诉我!'
model_id = 'damo/speech_sambert-hifigan_tts_zh-cn_16k'
sambert_hifigan_tts = pipeline(task=Tasks.text_to_speech, model=model_id)
output = sambert_hifigan_tts(input=text, voice='zhitian_emo')
wav = output[OutputKeys.OUTPUT_WAV]
with open('output.wav', 'wb') as f:
    f.write(wav)

结果展示如下,能够生成语音并且能够进行播放:
在这里插入图片描述
从多次搭建的经验来看,建议在搭建模型相关的内容的时候,优先选择阿里云的相关服务,很多东西阿里云的容器云已经提供底层技术,可以很快的使用modelscope提供的操作内容进行快速的模型搭建。


http://www.kler.cn/a/501678.html

相关文章:

  • [笔记] 使用 Jenkins 实现 CI/CD :从 GitLab 拉取 Java 项目并部署至 Windows Server
  • 初步了解JSON的基础概念
  • DDD - 微服务设计与领域驱动设计实战(上)_统一建模语言及事件风暴会议
  • 【Redis学习 | 第5篇】Redis缓存 —— 缓存的概念 + 缓存穿透 + 缓存雪崩 + 缓存击穿
  • 基于改进粒子群优化的无人机最优能耗路径规划
  • 探索AGI:智能助手与自我赋能的新时代
  • Seata的部署与微服务集成
  • pytorch张量的new_zeros方法介绍
  • python-leetcode-有效的数独
  • Java 将RTF文档转换为Word、PDF、HTML、图片
  • uniapp使用scss mixin抽离css常用的公共样式
  • PyTorch reshape函数介绍
  • 使用Cilium/eBPF实现大规模云原生网络和安全
  • MongoDB 删除集合
  • nginx增加新模块
  • Python orjson ujson有什么区别?
  • 【DevOps】Jenkins使用Pipeline构建java代码
  • AIGC是什么?怎么用?简单三步ToDesk云电脑快速用
  • 前端学习-焦点事件以及键盘事件与典型案例(二十五)
  • Node.js——http 模块(二)
  • (Arxiv-2023)LORA-FA:针对大型语言模型微调的内存高效低秩自适应
  • 软件系统安全逆向分析-混淆对抗
  • HTML + CSS:如何强制div内容保持一行?
  • 26个开源Agent开发框架调研总结(2)
  • 如何使用高性能内存数据库Redis
  • 基于异步IO的io_uring