当前位置: 首页 > article >正文

ChatTTS容器构建教程

一、模型介绍

ChatTTS 是专门为对话场景设计的文本转语音模型,例如 LLM 助手对话任务。它支持英文和中文两种语言。最大的模型使用了 10 万小时以上的中英文数据进行训练。在 HuggingFace 中开源的版本为 4 万小时训练且未 SFT 的版本。

ChatTTS WebUI如下:

屏幕截图

二、应用场景

ChatTTS适用于需要高质量语音交互的场景,包括但不限于以下部分:

  • 虚拟助手 :在聊天机器人或语言模型中,提供自然的语音回复,增强用户体验。
  • 智能客服 :在客户服务系统中,通过语音与用户交流,解决用户问题。
  • 教育娱乐 :在教育软件、有声读物、游戏等应用中,提供生动有趣的语音讲解和角色配音。
  • 无障碍辅助 :为视障人士提供语音阅读服务,帮助他们更好地获取信息。

三、容器构建过程

1、安装更新基础环境

apt update 
apt upgrade 
apt install build-essential 

image.png

2、创建虚拟环境

conda create -n chattts python=3.9
conda activate chattts

image.png

3、克隆项目仓库

apt install git
git lfs install
git clone https://www.modelscope.cn/studios/henjicc/ChatTTS.git

image.png

4、安装依赖环境

cd ChatTTS
pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple
pip install -r requirements.txt

image.png

5、指定端口,运行 app.py 文件

export GRADIO_SERVER_NAME=0.0.0.0
export GRADIO_SERVER_PORT=8080
python3 app.py

image.png

四、ChatTTS WebUI界面展示

回到容器端,开放端口后获取访问地址,浏览器输入网址,搜索进入WebUI界面,在Input Text下方输入想要转音频的文本,点击Generate,等待一段时间即可得到音频。点击音频下方的播放按钮,就可以对转化结果进行展示。

屏幕截图


http://www.kler.cn/a/283486.html

相关文章:

  • Vue2:组件
  • 基于海思soc的智能产品开发(两个图像处理来源)
  • 【2024软考架构案例题】你知道 Es 的几种分词器吗?Standard、Simple、WhiteSpace、Keyword 四种分词器你知道吗?
  • UniApp 应用、页面与组件的生命周期详解
  • neo4j desktop基本入门
  • 一文简单了解Android中的input流程
  • C++基础知识:关系运算符重载以及相关代码演示
  • Java基础(5)- Java代码笔记2
  • 面向对象分析和设计OOA和OOD的区别和联系?
  • 服务器被渗透的表现及检测方法
  • windows安全软件之火绒杀毒的密码忘记后处理
  • erlang学习:用OTP构建系统3,应用程序服务器
  • SQL 优化实践:从慢查询到高性能更新
  • Sinc Function介绍
  • 【Python机器学习】NLP词频背后的含义——距离和相似度
  • 【二叉树进阶】--- 前中后序遍历非递归
  • python之zip函数
  • 【大模型系列篇】词向量 - 从Word2Vec到ELMo
  • C# 匿名函数 delegate(参数...){ }
  • LeetCode 热题100-41 二叉树的层序遍历
  • 如何使用 Pytest 进行测试
  • SSRF和CSRF实战复现
  • 【自动驾驶】决策规划算法概述
  • Kafka消息积压的典型场景及解决方案
  • SSRF以及CSRF
  • Vue3.0项目实战(二)——大事件管理系统登录注册功能实现