当前位置: 首页 > article >正文

ASR-LLM-TTS 实时语音对话助手:语音识别、大模型对话、声音生成

参考:https://blog.csdn.net/weixin_42357472/article/details/137020794

asr:funasr-SenseVoiceSmall 离线
llm:deepseek 在线api
tts:edge-tts 在线api


import pyaudio
import wave
import threading
import numpy as np
import time
from queue import Queue
import webrtcvad
import os
import threading
import requests
import json
from funasr import AutoModel
import pygame
import edge_tts
import asyncio
from time import sleep
import langid
from langdetect import detect
import re
from pypinyin import pinyin, Style
from modelscope.pipelines import pipeline
from openai import OpenAI


# --

http://www.kler.cn/a/440779.html

相关文章:

  • Fiddler简单使用
  • 【Lua】Lua 基础语法
  • spring cloud contract http实例
  • C和C++的函数指针
  • 游戏引擎学习第52天
  • 【mybatis】mapper.xml文件DOCTYPE含义
  • 【Rust自学】3.4. 函数和注释
  • LLM常见面试题(16-20题)
  • 牛客--字符串加密
  • 常见软件设计模式介绍:三层架构、MVC、SSM、EDD、DDD
  • 通过使用 contenteditable=“true“,我们彻底防止了 iOS 系统键盘的弹出
  • 家具购物小程序+php
  • Pytest-Bdd vs Behave:选择最适合的 Python BDD 框架
  • AIDD-人工智能药物设计-ChemDraw Mac版pojie安装
  • 基于Spring Boot的数码产品抢购系统
  • 常见的数据结构和应用场景
  • Serverless核心组件、最佳实践及性能优化
  • 向量数据库Faiss C++
  • Hololens 2 Unity VS2019编译报错解决方案
  • Go, Jocko, Kafka