当前位置: 首页 > article >正文

esp32学习:语音识别教程esp-skainet库的使用

           乐鑫推出了基于esp_sr算法的语音识别应用esp-skainet。官方介绍:ESP-Skainet 以最便捷的方式支持基于乐鑫的 ESP32系列 芯片的唤醒词识别和命令词识别应用程序的开发。使用 ESP-Skainet,您可以轻松构建唤醒词识别和命令词识别应用程序。

支持的主要功能:

源码仓库链接:

esp-skainet: ESP-Skainet 是乐鑫推出的智能语音助手,目前支持唤醒词识别和命令词识别。

esp-skainet: ESP-Skainet 是乐鑫推出的智能语音助手,目前支持唤醒词识别和命令词识别。

下面介绍一下这个库的使用:

       准备工作:推荐使用我们的虫洞ESP32-S3-EYE AI开发板 开发板虫洞ESP32-S3...-淘宝网 (taobao.com);

店铺连接:首页-虫洞嵌入式1号-淘宝网 (taobao.com)

一.下载仓库

git clone https://gitee.com/EspressifSystems/esp-skainet.gitesp-skainet: ESP-Skainet 是乐鑫推出的智能语音助手,目前支持唤醒词识别和命令词识别。icon-default.png?t=O83Ahttps://gitee.com/EspressifSystems/esp-skainet.git

同样可以用esp-gitee-tools更新./submodule-update.sh ../esp-skainet/

我的代码结构是这样的:

二.编译测试例程

(1).导环境变量:在idf路径下. ./export.sh

(2)到测试例程(以cn_speech_commands_recognition为例)目录下配置芯片idf.py set-target esp32s3

(3)运行idf.py menuconfig配置flash:

(4)选择我们的开发板:

(5)保存,退出,编译idf.py build

(6) 下载测试:idf.py flash monitor

看到下面log就可以测试语音了

对着麦克风说“hi,乐鑫“可以唤醒电路板,接着说”打开空调“,可以看到log打出了打开空调的命令:

里面具体的代码实现,大家对着log看对应的代码就可以理解了。

三、自定义唤醒词和命令

自定义唤醒词:乐鑫语音唤醒方案客户定制流程 - ESP32-S3 - — ESP-SR latest 文档  https://docs.espressif.com/projects/esp-sr/zh_CN/latest/esp32s3/wake_word_engine/ESP_Wake_Words_Customization.html

自定义命令:

命令词 - ESP32-S3 - — ESP-SR latest 文档 https://docs.espressif.com/projects/esp-sr/zh_CN/latest/esp32s3/speech_command_recognition/README.html

        希望对你有帮助,谢谢!


http://www.kler.cn/news/368290.html

相关文章:

  • B端产品常用组件及设计规则 原型图 Axure原型图 交互设计
  • GoogleChrome的安装和使用
  • python源码编译—Cython隐藏源码(windows)
  • Matplotlib教程(005):Matplotlib双轴显示
  • pytorch调用手写CUDA算子和pybind11的使用
  • 正则表达式基本语法(快速认知)
  • 【AIGC】2024-ECCV-ControlNet++:通过有效的一致性反馈改进条件控制
  • LINUX基于多IP访问多网站练习
  • 计算机的错误计算(一百三十六)
  • light-task-scheduler的dockerfile打包配置
  • B+树(B树的改进)
  • (九)Proteus仿真STM32单片机硬件I2C和模拟I2C读写PCF8563时钟
  • 【路径跟踪控制:Pure Pursuit控制与车辆运动学模型】
  • Web应用框架-Django应用基础(3)-Jinja2
  • HTML 基础:构建网页结构的基石
  • Java中的反射(3)——反射的应用场景
  • 微信小程序的日期区间选择组件的封装和使用
  • 重学SpringBoot3-Spring WebFlux之SSE服务器发送事件
  • 【jellyfin】解决Edge 浏览器播放 jellyfin 的 hevc/h265 视频“该客户端与媒体不兼容,服务器未发送兼容的媒体格式”错误
  • Vue.js 把字典类型的数据转化为键值对数据,符合echart格式,key-value键值对
  • 微信小程序瀑布流实现,瀑布流长度不均等解决方法
  • 【AI辅助】AWS Toolkit+AmazonQ
  • Python条形图 | 指标(特征)重要性图的绘制
  • 提示工程(Prompt Engineering)指南(入门篇)
  • django中的类属性和类方法
  • A股未来的发展方向在哪里?