当前位置: 首页 > article >正文

颠覆性语音识别:单词级时间戳和说话人分离

vbenjs/vue-vben-admin[1]

Stars: 19.7k  License: MIT

图片

Vue Vben Admin 是一个免费开源的中后台模板,使用最新的 vue3、vite4 和 TypeScript 等主流技术进行开发。该项目提供了现成的中后台前端解决方案,并可用于学习参考。

  • 使用先进的前端技术如 Vue3/vite2 进行开发

  • 应用级 JavaScript 语言 TypeScript

  • 可配置化主题

  • 内置完整国际化方案

  • 内置 Mock 数据方案

  • 内置完整动态路由权限生成方案

pure-admin/vue-pure-admin[2]

Stars: 10.7k  License: MIT

图片

vue-pure-admin 是一款开源免费且开箱即用的中后台管理系统模版。主要功能包括使用最新的 Vue3、Vite、Element-Plus、TypeScript 等技术进行开发。该项目具有以下核心优势和特点:

  • 精简版打包大小低于 2.3MB,在全局引入 element-plus 情况下仍然低于 350kb

  • 支持非国际化精简版和国际化精简版两个版本选择

  • 提供配套视频教程和 UI 设计文档

  • 可以在 Gitpod 在线环境中快速开始编码

  • 支持 Docker 容器部署预览

arc53/DocsGPT[3]

Stars: 6.7k  License: MIT

图片

DocsGPT 是一个开源的文档助手项目,它集成了强大的 GPT 模型,可以简化在项目文档中查找信息的过程。开发人员可以轻松提问关于项目的问题,并获得准确答案。

wasp-lang/wasp[4]

Stars: 6.1k  License: MIT

图片

Wasp 是一个用于 React、Node.js 和 Prisma 的类似 Rails 的框架,它可以快速开发全栈 Web 应用程序。以下是 Wasp 项目的主要功能和核心优势:

  • 快速入门:由于其表达能力强,您只需使用非常少量简洁、一致且声明性代码即可从头开始创建并部署生产就绪的 Web 应用程序。

  • 无样板文件:通过抽象复杂的全栈特性,减少了样板代码。这意味着更少需要维护和理解的代码!也意味着更容易升级。

  • 无锁定:您可以在任何地方部署 Wasp 应用程序。没有对特定提供商进行锁定,在代码上具有完全控制权。

其他关键功能包括 Full-stack Auth,RPC (Client <-> Server),Simple Deployment,Jobs,Email Sending 以及 Full-stack Type Safety 等。

m-bain/whisperX[5]

Stars: 5.6k  License: BSD-4-Clause

图片

WhisperX 是一个语音识别开源项目,具有单词级时间戳和说话人分离功能。

  • 使用 whisper large-v2 进行批量推理,以达到 70 倍的实时转录

  • faster-whisper 后端更快,并且对于 large-v2 模型只需要小于 8GB GPU 内存

  • 使用 wav2vec2 对齐来获得准确的单词级时间戳

  • 利用 pyannote-audio 中的说话人分离技术进行多说话人 ASR (带有说话者 ID 标签)

  • VAD 预处理可以降低幻听问题,并在不影响 WER 情况下进行批处理

ckan/ckan[6]

Stars: 4.0k  License: NOASSERTION

图片

CKAN 是世界领先的开源数据门户平台,它使发布、共享和处理数据变得简单。作为一个数据管理系统,CKAN 提供了强大的平台来编目、存储和访问各种数据集,并具有丰富的前端界面、完整的 API (用于数据和目录)、可视化工具等功能。

  • 提供强大而易用的平台来编目、存储和访问各种类型的数据集

  • 具备全面覆盖前后端需求以及可扩展性高效能力

  • 支持自定义主题风格与多语言支持

相关链接

1、vbenjs/vue-vben-admin: https://github.com/vbenjs/vue-vben-admin

2、pure-admin/vue-pure-admin: https://github.com/pure-admin/vue-pure-admin

3、arc53/DocsGPT: https://github.com/arc53/DocsGPT

4、wasp-lang/wasp: https://github.com/wasp-lang/wasp

5、m-bain/whisperX: https://github.com/m-bain/whisperX

6、ckan/ckan: https://github.com/ckan/ckan


http://www.kler.cn/a/156481.html

相关文章:

  • 【优选算法篇】:深入浅出位运算--性能优化的利器
  • vue3 初体验
  • 大模型训练(2):内存开销
  • 【面试题】技术场景 4、负责项目时遇到的棘手问题及解决方法
  • strace、ltrace、ftrace 和 dtrace
  • 极大似然估计笔记
  • nodejs的安装和验证
  • 2023/11/30JAVAweb学习(postman,各种参数,统一响应数据,三层架构,分层解耦,bean组件扫描,Bean注入及解决方式)
  • python-绘图(主次坐标轴)
  • windows11 调整鼠标灵敏度方法
  • 分享73个节日PPT,总有一款适合您
  • LeetCode [中等]岛屿数量
  • 安卓8预装可卸载应用
  • 关于开展人工智能专业人员“自然语言及语音处理设计开发工程师”专项培训的通知
  • 2.Ansible的copy模块,我最常用的模块
  • 动能资讯 | 智能音箱—万物物联新纽带
  • SSL证书 免费
  • MacOS14 Sonoma 安装 Flutter 开发环境
  • CRM助力销售:提升效率与业绩的双刃剑!
  • undo log 具体怎么回滚事务,如何查询慢 SQL 产生的原因
  • 1688API接口系列,1688开放平台接口使用方案(商品详情数据+搜索商品列表+商家订单类)
  • 数据库SQL中的三个语句:DROP、TRUNCATE 、DELETE 以上三种的区别? 效率?
  • JavaWeb | 验证码 、 文件的“上传”与“下载”
  • 8g-pwm
  • 【程序员 | 交流】程序员情商修炼指南系列 (沟通是有效合作一大利器)
  • 人工智能算法