当前位置：首页 > article >正文

人工智能之基于阿里云快速搭建语音合成

article 2025/1/14 4:18:03

人工智能之基于阿里云快速搭建语音合成

需求描述

基于阿里云搭建语音合成模型，模型名称：iic/speech_sambert-hifigan_tts_zh-cn_16k
使用上述模型输入一段文字合成语音，模型路径

业务实现

阿里云配置

阿里云配置如下：
在这里插入图片描述

代码验证

from modelscope.outputs import OutputKeys
from modelscope.pipelines import pipeline
from modelscope.utils.constant import Tasks

text = '你好！我是一个人工智能助手，专门帮助用户回答问题、提供信息和解决问题。我可以回答各种主题，包括科学、技术、文学、历史等。\
        如果你有任何问题或者需要帮助的地方，请随时告诉我！'
model_id = 'damo/speech_sambert-hifigan_tts_zh-cn_16k'
sambert_hifigan_tts = pipeline(task=Tasks.text_to_speech, model=model_id)
output = sambert_hifigan_tts(input=text, voice='zhitian_emo')
wav = output[OutputKeys.OUTPUT_WAV]
with open('output.wav', 'wb') as f:
    f.write(wav)

结果展示如下，能够生成语音并且能够进行播放：
在这里插入图片描述
从多次搭建的经验来看，建议在搭建模型相关的内容的时候，优先选择阿里云的相关服务，很多东西阿里云的容器云已经提供底层技术，可以很快的使用modelscope提供的操作内容进行快速的模型搭建。

http://www.kler.cn/a/501678.html

相关文章：

[笔记] 使用 Jenkins 实现 CI/CD ：从 GitLab 拉取 Java 项目并部署至 Windows Server

初步了解JSON的基础概念

DDD - 微服务设计与领域驱动设计实战(上)_统一建模语言及事件风暴会议

【Redis学习 | 第5篇】Redis缓存 —— 缓存的概念 + 缓存穿透 + 缓存雪崩 + 缓存击穿

基于改进粒子群优化的无人机最优能耗路径规划

探索AGI：智能助手与自我赋能的新时代

Seata的部署与微服务集成

pytorch张量的new_zeros方法介绍

python-leetcode-有效的数独

Java 将RTF文档转换为Word、PDF、HTML、图片

uniapp使用scss mixin抽离css常用的公共样式

PyTorch reshape函数介绍

使用Cilium/eBPF实现大规模云原生网络和安全

MongoDB 删除集合

nginx增加新模块

Python orjson ujson有什么区别？

【DevOps】Jenkins使用Pipeline构建java代码

AIGC是什么？怎么用？简单三步ToDesk云电脑快速用

前端学习-焦点事件以及键盘事件与典型案例（二十五）

Node.js——http 模块（二）

（Arxiv-2023）LORA-FA：针对大型语言模型微调的内存高效低秩自适应

软件系统安全逆向分析-混淆对抗

HTML + CSS:如何强制div内容保持一行？

26个开源Agent开发框架调研总结（2）

如何使用高性能内存数据库Redis

基于异步IO的io_uring