当前位置: 首页 > article >正文

python 语音识别

目录

一、语音识别

二、代码实践

2.1 使用vosk三方库

2.2 使用SpeechRecognition

2.3 使用Whisper


一、语音识别

今天识别了别人做的这个app,觉得虽然是个日记app 但是用来学英语也挺好的,能进行语音识别,然后矫正语法,自己说的时候 ,实在不知道怎么说可以先乱说,然后后续矫正,在把这个不会的点学起来。然后我就研究了下语音识别的技术方案。

语音识别(Speech Recognition)是一种将人类语音转换为可理解的文本或指令的技术。它的核心原理是通过对声音信号进行捕捉、特征提取和模式匹配,将语音信号映射到相应的文字或指令上。常见的语音识别应用包括:

  1. 语音助手:如苹果的Siri、谷歌助手、小度等,可根据语音指令执行任务,回答问题。
  2. 智能家居控制:通过语音

http://www.kler.cn/a/527562.html

相关文章:

  • 力扣动态规划-16【算法学习day.110】
  • Day52:range()函数
  • 【LLM】Ollama框架入门指北
  • Xposed-Hook
  • PYH与MAC的桥梁MII/MIIM
  • 【漫话机器学习系列】068.网格搜索(GridSearch)
  • 如何在 Kafka 中实现自定义分区器
  • 27.Word:财务软件应用的书稿【10】
  • 数据结构与算法之二叉树: LeetCode LCP 10. 二叉树任务调度 (Ts版)
  • 记忆化搜索(5题)
  • 因果推断与机器学习—用机器学习解决因果推断问题
  • 为AI聊天工具添加一个知识系统 之80 详细设计之21 符号逻辑 之1
  • Contrastive Imitation Learning
  • 基于SpringCloud的广告系统设计与实现(四)
  • vue3项目中编写less
  • 华为Ascend产品
  • STM32CubeMX6.13.0打开后不显示界面,但是任务管理器显示该程序正在运行
  • 深入理解Flexbox:弹性盒子布局详解
  • OpenSource - 通过 system-design-101 掌握架构设计
  • git:恢复纯版本库
  • 机试题——考古学家
  • C语言实现库函数strlen
  • 2025年1月30日(任意截面、自定义截面梁的设置)
  • MYSQL--一条SQL执行的流程,分析MYSQL的架构
  • Privacy Eraser,电脑隐私的终极清除者
  • 基于UKF-IMM无迹卡尔曼滤波与交互式多模型的轨迹跟踪算法matlab仿真,对比EKF-IMM和UKF