当前位置: 首页 > article >正文

【文献阅读】自动化构音障碍严重程度分类:声学特征与深度学习技术的研究

自动化构音障碍严重程度分类:声学特征与深度学习技术的研究

文章目录

  • 自动化构音障碍严重程度分类:声学特征与深度学习技术的研究
    • 思维导图
    • 摘要
    • I. 引言
      • A. 动机与相关工作
    • II. 数据库
    • III. 实验设计
      • A. 分析 MFCC 和 CQCC
      • B. 分析语言障碍特定特征
      • C. 分析 i-向量
    • IV. 特征设计
    • V. 分类器设计
      • A. 基线分类器
      • B. 深度学习分类器
    • VI. 结果与讨论
      • A. 分析 MFCC 和 CQCC (E1)
      • B. 分析语言障碍特定特征 (E2)
      • C. 分析 i-向量 (E3)
      • D. 评估模型的说话者依赖性
      • E. 讨论
    • VII. 结论

原文名称Automated Dysarthria Severity Classification:
A Study on Acoustic Features and Deep Learning Techniques

思维导图

在这里插入图片描述

摘要

  • 评估构音障碍的严重程度可以提供患者改善的见解,并协助治疗计划的制定。
  • 本研究比较了使用各种深度学习架构和声学特征的构音障碍严重程度分类。
  • 评估的架构包括:DNN、CNN、GRU 和 LSTM,使用基本特征如 MFCC 和 CQCC。
  • 分析了来自韵律、发音、音质和声门功能的演讲障碍特定特征。
  • 探索通过 i-向量实现低维特征表示,并使用 DNN 进行分类。
  • 在说话者依赖情况中实现了 93.97% 的准确率,而在说话者独立情况下实现了 49.22% 的准确率。

I. 引言

  • 构音障碍是由于发声系统的协调不良,影响

http://www.kler.cn/a/412579.html

相关文章:

  • Vuex中通过action触发mutation是为什么?[AI]
  • BERT的配置
  • 消息队列实战指南
  • uni-app 自定义平台如何进行 static 目录的条件编译
  • 排序算法之插入排序篇
  • NestJS中使用useClass注入
  • 【ubuntu24.04】hnsw liblibstdc++.so.6: version GLIBCXX_3.4.32‘ not found
  • 【docker集群应用】Docker网络与资源控制
  • vscode中json文件的注释飘红
  • 实现跨语言通信:Rust 和 Thrift 的最佳实践
  • Python初始化变量
  • CodeIgniter中的重映射方法调用
  • 如何借助AI生成PPT,让创作轻松又高效
  • WPS表格学习计划与策略
  • 35 基于单片机的精确电压表DA-AD转换
  • UniApp开发实战:常见报错解析与解决方案
  • VTK中对于相机camera的设置
  • 前端 vue3 + element-plus + ts 隐藏表头的全选框
  • Hive安装 保姆级安装教程
  • LLM大模型意图识别:分类算法lora训练案例