当前位置：首页 > article >正文

Python知识点：如何使用Python实现语音识别

article 2025/3/1 0:07:07

要在 Python 中实现语音识别，你可以使用 SpeechRecognition 库，它是一个功能强大的库，能够识别音频中的语音并将其转换为文本。下面是一个简单的示例代码，展示如何使用这个库进行语音识别。

步骤 1：安装依赖库

首先，你需要安装 SpeechRecognition 库和 pyaudio 库。你可以使用以下命令安装这些库：

pip install SpeechRecognition
pip install pyaudio

注意：在某些系统中安装 pyaudio 可能会遇到困难，可以使用预编译的二进制文件进行安装，或参考官方文档。

步骤 2：使用 Python 代码进行语音识别

以下是一个使用 SpeechRecognition 库从麦克风获取音频并进行语音识别的示例代码：

import speech_recognition as sr

# 创建一个识别器实例
recognizer = sr.Recognizer()

# 使用麦克风作为音频源
with sr.Microphone() as source:
    print("请说话...")
    # 调整环境噪声的影响
    recognizer.adjust_for_ambient_noise(source)
    # 录制音频
    audio = recognizer.listen(source)

    try:
        # 使用Google Web Speech API将音频转换为文本
        text = recognizer.recognize_google(audio, language="zh-CN")
        print("你说了: " + text)
    except sr.UnknownValueError:
        print("无法识别音频")
    except sr.RequestError as e:
        print(f"无法请求语音识别服务; {e}")

代码说明：

sr.Recognizer(): 创建一个语音识别器对象。
sr.Microphone(): 使用麦克风作为音频源。
adjust_for_ambient_noise(source): 调整音频录制时的环境噪声。
recognizer.listen(source): 监听并录制音频。
recognizer.recognize_google(audio, language="zh-CN"): 使用 Google Web Speech API 将音频转换为文本。你可以指定不同的语言，比如 "en-US" 表示美国英语，"zh-CN" 表示简体中文。