当前位置：首页 > article >正文

【ODSS】An Open Dataset of Synthetic Speech

article 2024/10/23 17:03:01

An Open Dataset of Synthetic Speech

会议/期刊：WIFS 2023
作者：
在这里插入图片描述

一个由合成语音和自然语音组成的多语言、多说话人数据集ODSS，旨在促进合成语音检测的研究和基准测试。
是由156个声音生成的合成语音，跨越三种语言，即英语、德语和西班牙语，具有平衡的性别代表性。

为研究人员提供来自不同说话者、语言和说话风格的全面多样的语音样本，包括真实语音样本和使用文献中可用的最新文本到语音（TTS）语音合成模型生成的合成语音样本。

数据集是从开源TTS数据集聚合的语音数据生成的。

在这里插入图片描述
该数据集的主要缺点是生成的数据没有

WebRTC音频 03 - 实时通信框架

YOLOV11改进系列指南

pandas 数据分析实战

.net framework 3.5sp1如何开启？

SpringBoot3 + OpenAPI3规范快速整合

el-table 表格设置必填项

spring boot实现不停机更新

ford面试准备

传输层协议——TCP、UDP

玩转springboot之springboot异步执行

苍穹外卖学习笔记(二十六)