当前位置: 首页 > article >正文

开源的说话人分离项目 | 可以对指定的音频分离不同的说话人 | 通话录音中分离不同的说话人

项目地址

https://github.com/lukeewin/AudioSeparationGUI

运行环境

任意 PC 端
python version >= 3.8

安装

如果使用 GPU 来运行,需要安装好 CUDA
安装 ffmpeg,可以到 ffmpeg 官方地址中下载可执行程序,配置环境变量
按依赖

pip install -U funasr modelscop ffmpeg-python

安装 torch,需要根据你电脑情况安装不同的版本,具体可以到 torch 中复制命令安装

运行

python app.py

效果

本地可运行的说话人拆分 | 说话人分离

其它

这个程序适合个人 PC 端使用,如果需要服务端接口,支持多路并发,支持大规模集群部署,欢迎联系我。
个人技术博客1:https://lukeewin.top
个人技术博客2:https://blog.lukeewin.top


http://www.kler.cn/a/396135.html

相关文章:

  • 【2025最新计算机毕业设计】基于SpringBoot+Vue电脑在线装机指南教程网站【源码+文档】
  • JDBC-Mysql 时区问题详解
  • 如何优化Kafka消费者的性能
  • Qt 日志文件的滚动写入
  • 【视觉SLAM】1-概述
  • 怎么选择香港服务器的线路?解决方案
  • 开发中SQL积累
  • 量子奇异值阈值算法
  • vue3: ref, reactive, readonly, shallowReactive
  • Django Form
  • 【计算机网络】TCP网络特点2
  • 理解Go中的append函数及其返回值
  • MFC中Picture Control控件显示照片的几种方式
  • python基础 基本数据类型 执行顺序 条件判断 常用字符串操作 常用工具类
  • 英伟达 Isaac ROS产品体验
  • Java—— 正则表达式
  • 【系统架构设计师】真题论文: 论基于 DSSA 的软件架构设计与应用(包括解题思路和素材)
  • Nacos黑马笔记
  • 前端知识点---this的用法 , this动态绑定(Javascript)
  • 大数据如何助力干部选拔的公正性
  • 宝塔面板从 Nginx 切换到 Caddy:详细教程
  • 麒麟时间同步搭建chrony服务器
  • Python学习从0到1 day26 第三阶段 Spark ④ 数据输出
  • 发布rust crate
  • SpringCloud篇(服务提供者/消费者)(持续更新迭代)
  • 时序数据基础TDEngine