当前位置: 首页 > article >正文

【ODSS】An Open Dataset of Synthetic Speech

文章目录

  • An Open Dataset of Synthetic Speech
  • key points
  • ODSS数据集
  • 局限性

An Open Dataset of Synthetic Speech

会议/期刊:WIFS 2023
作者:
在这里插入图片描述

key points

一个由合成语音和自然语音组成的多语言、多说话人数据集ODSS,旨在促进合成语音检测的研究和基准测试。
是由156个声音生成的合成语音,跨越三种语言,即英语、德语和西班牙语,具有平衡的性别代表性。

为研究人员提供来自不同说话者、语言和说话风格的全面多样的语音样本,包括真实语音样本和使用文献中可用的最新文本到语音(TTS)语音合成模型生成的合成语音样本。

数据集是从开源TTS数据集聚合的语音数据生成的

在这里插入图片描述
该数据集的主要缺点是生成的数据没有


http://www.kler.cn/news/361831.html

相关文章:

  • [云] 创建 Docker 镜像,将其推送到 Amazon Elastic Container Registry (ECR),并对已部署的应用程序进行负载测试
  • 嵌套div导致子区域margin失效问题解决
  • 单片机输出方波
  • Ping命令的详细请求过程
  • rabbitMQ消息重复问题怎么解决的?
  • 全光网络架构
  • WebRTC音频 03 - 实时通信框架
  • NeRF三维重建—神经辐射场Neural Radiance Field(二)体渲染相关
  • 5G智能终端:低空经济崛起的隐形翅膀!
  • 销售出库单同步——从旺店通到金蝶云星辰V2的成功案例
  • YOLOV11改进系列指南
  • pandas 数据分析实战
  • .net framework 3.5sp1如何开启?
  • SpringBoot3 + OpenAPI3规范 快速整合
  • el-table 表格设置必填项
  • Python实现股票自动交易:步骤、要点与注意事项有哪些?
  • spring boot实现不停机更新
  • ford面试准备
  • 传输层协议——TCP、UDP
  • 正在等待缓存锁:无法获得锁 /var/lib/dpkg/lock-frontend。锁正由进程 5427(unattended-upgr)持有
  • PPT自动化:如何判断PPT中的shape类型(python-pptx中常见shape类型及其代码速查表)
  • C++进阶之路:日期类的实现、const成员(类与对象_中篇)
  • 基于SSM+小程序的就业管理系统(就业1)
  • 玩转springboot之springboot异步执行
  • 2024年第四期丨全国数字人才技能提升师资培训班
  • 苍穹外卖学习笔记(二十六)