当前位置：首页 > article >正文

【文献阅读】基于原型的自适应方法增强未见到的构音障碍者的语音识别

article 2025/2/21 3:50:00

https://www.isca-archive.org/interspeech_2024/wang24x_interspeech.pdf

构音障碍是一种由神经系统疾病或肌肉异常引起的言语障碍，影响了个体清晰发音的能力。这种情况常伴随脑瘫、帕金森病和头部创伤等疾病。对于受影响的人来说，由于其有限的运动能力，语音是与设备互动的最方便手段。然而，传统的语音识别系统难以处理构音障碍者的语音，因为其显著偏离了典型的语音模式。

传统的说话人自适应方法涉及对每个说话人进行微调，但由于高成本和用户的不便，这些方法不可行。为了解决这个问题，作者提出了一种基于原型的方法，以在无需额外微调的情况下提升未见到的构音障碍者的语音识别性能。

HuBERT（Hidden-Unit BERT）是一个预训练的自监督语音模型，旨在从大量的无标签语音数据中学习有效的表达。它通过预测隐藏单元来学习语音特征，这些隐藏单元是通过对语音信

分布式消息中间件kafka

Java接口和抽象类的区别

设计模式-依赖注入

Mac剪贴板历史全记录！

turtle实现贪吃蛇小游戏

面试题（二）

动态路由---OSPF协议基础

配置实验用的 Rocky Linux

常见单片机