当前位置：首页 > article >正文

基于机器学习的齿音识别

article 2025/4/1 21:53:59

因为大一上完就不写matu，好久不更了

但回到CSDN上一看居然还有小灯在关注我，这下不得不写点东西了（）

源于智能嵌入式系统设计的课设。下一步还会继续做，有兴趣的同学可以联系我一起搞嘞（发烧友更好嘻嘻，一起 hifi ，科 hi 党才是最 hifi 的！！），之后目标是进一步减小失真、加快处理速度、部署到FPGA上

项目全文在github，可以 star 一下捏 OvO

GitHub - Circulation-Beichen/DentalTone_Wiping_NoMusicAudio: 基于机器学习的齿音抑制

其实名字起错了，应该叫DeEsser，但是到后来才知道齿音消除应该这样翻译。

项目到现在也只是一个半成品，本质上是对于音频中高于3.5kHz的分量进行削波

- 人肉特征提取（之后可以改成基于机器学习的特征提取，可以提取到更好的特征）
   - 最大值、最小值、中值、微分滤波器都尝试，微分滤波器效果最好
   - 设阈值，-30dB 以下的点全部去掉
   - 3.5kHz 以下的点全部去掉
- 膨胀，希望能填充一下，人眼看上去找出的齿音频谱是不连续的
- DBSCAN 聚类，去掉一些噪声（小的聚类）
- 目前，本质上是对 3.5kHz 频率以上的，幅度较大的高频分量进行削波，并没有识别出来齿音