当前位置: 首页 > article >正文

基于机器学习的齿音识别

因为大一上完就不写matu,好久不更了

但回到CSDN上一看居然还有小灯在关注我,这下不得不写点东西了()

源于智能嵌入式系统设计的课设。下一步还会继续做,有兴趣的同学可以联系我一起搞嘞(发烧友更好嘻嘻,一起 hifi ,科 hi 党才是最 hifi 的!!),之后目标是进一步减小失真、加快处理速度、部署到FPGA上

项目全文在github,可以 star 一下捏 OvO

GitHub - Circulation-Beichen/DentalTone_Wiping_NoMusicAudio: 基于机器学习的齿音抑制

其实名字起错了,应该叫DeEsser,但是到后来才知道齿音消除应该这样翻译。

项目到现在也只是一个半成品,本质上是对于音频中高于3.5kHz的分量进行削波

- 人肉特征提取(之后可以改成基于机器学习的特征提取,可以提取到更好的特征)
    - 最大值、最小值、中值、微分滤波器都尝试,微分滤波器效果最好
    - 设阈值,-30dB 以下的点全部去掉
    - 3.5kHz 以下的点全部去掉
- 膨胀,希望能填充一下,人眼看上去找出的齿音频谱是不连续的
- DBSCAN 聚类,去掉一些噪声(小的聚类)
- 目前,本质上是对 3.5kHz 频率以上的,幅度较大的高频分量进行削波,并没有识别出来齿音


http://www.kler.cn/a/625051.html

相关文章:

  • Python爬虫-爬取大麦网演出详情页面数据
  • 【云原生】在Kubernetes上搭建Keycloak26.1.4
  • 创新杂谈:“<em >快</em><em>3</em><em>倍</em><em>投</em><em>平</em><em>台
  • ResNet改进:SE模块和多尺度模块两次改进
  • 0330-YYYY-MM-DD格式日期比较大小
  • pycharm虚拟环境项目转移后配置解释器
  • P1091 [NOIP 2004 提高组] 合唱队形
  • 科大讯飞语音转文字STT--unity
  • 蓝桥杯备赛:求圆的面积
  • 如何备份你的 Postman 所有 Collection?
  • HTML5和CSS3的一些特性
  • 简易指南“<em >快</em><em>3</em><em>倍</em><em>投</em><em>规</em><em>划
  • QtAV入门
  • 我的世界1.20.1forge进阶模组开发教程——生物群系(2)
  • 创作领域“<em >彩</em><em>票</em><em>导</em><em>师</em><em>带</em><em>玩</em><em>群
  • QtAdvancedStylesheets使用
  • jarvisoj API调用 [JSON格式变XXE]
  • 什么是 JavaScript 中的原型链(Prototype Chain)?
  • yum install 报错(CentOS换源):
  • 05-02-自考数据结构(20331)- 动态查找-知识点