当前位置：首页 > article >正文

开源的说话人分离项目 | 可以对指定的音频分离不同的说话人 | 通话录音中分离不同的说话人

article 2025/3/11 16:59:05

项目地址

https://github.com/lukeewin/AudioSeparationGUI

任意 PC 端
python version >= 3.8

如果使用 GPU 来运行，需要安装好 CUDA
安装 ffmpeg，可以到 ffmpeg 官方地址中下载可执行程序，配置环境变量
按依赖

pip install -U funasr modelscop ffmpeg-python

安装 torch，需要根据你电脑情况安装不同的版本，具体可以到 torch 中复制命令安装

python app.py

本地可运行的说话人拆分 | 说话人分离

这个程序适合个人 PC 端使用，如果需要服务端接口，支持多路并发，支持大规模集群部署，欢迎联系我。
个人技术博客1：https://lukeewin.top
个人技术博客2：https://blog.lukeewin.top

开发中SQL积累

量子奇异值阈值算法

vue3: ref, reactive, readonly, shallowReactive

Django Form

【计算机网络】TCP网络特点2

理解Go中的append函数及其返回值

英伟达 Isaac ROS产品体验

Java—— 正则表达式

Nacos黑马笔记

大数据如何助力干部选拔的公正性

麒麟时间同步搭建chrony服务器

发布rust crate

时序数据基础TDEngine