xiaozhi-esp32 - 基于 ESP32 的 AI 聊天机器人
xiaozhi-esp32是一款基于 ESP-IDF 开发框架的开源硬件项目,旨在利用低成本硬件打造个人专属的 AI 聊天机器人。它通过 WebSocket 或 UDP 协议与 LLM、TTS API 服务连接,实现实时语音交互功能,无需在设备上运行 LLM,支持中文在内的多国语言、语音识别用户身份、自定义提示词和音色等功能,兼容多款 ESP32 开发板。
3500 Stars 545 Forks 19 Issues 12 贡献者 MIT License C 语言
代码: GitHub - 78/xiaozhi-esp32: Build your own AI friend
更多AI开源软件:AI开源 - 小众AI
主要功能
- Wi-Fi / ML307 Cat.1 4G
- BOOT 键唤醒和打断,支持点击和长按两种触发方式
- 离线语音唤醒 ESP-SR
- 流式语音对话(WebSocket 或 UDP 协议)
- 支持国语、粤语、英语、日语、韩语 5 种语言识别 SenseVoice
- 声纹识别,识别是谁在喊 AI 的名字 3D Speaker
- 大模型 TTS(火山引擎 或 CosyVoice)
- 大模型 LLM(Qwen2.5 72B 或 豆包 API)
- 可配置的提示词和音色(自定义角色)
- 短期记忆,每轮对话后自我总结
- OLED / LCD 显示屏,显示信号强弱或对话内容
安装和使用
面包板手工制作实践
详见飞书文档教程:
👉 《小智 AI 聊天机器人百科全书》
已支持的开源硬件
- 立创·实战派 ESP32-S3 开发板
- 乐鑫 ESP32-S3-BOX3
- M5Stack CoreS3
- AtomS3R + Echo Base
- 神奇按钮 2.4
- 虾哥 Mini C3
- 微雪电子 ESP32-S3-Touch-AMOLED-1.8
固件部分
免开发环境烧录
新手第一次操作建议先不要搭建开发环境,直接使用免开发环境烧录的固件。固件使用的是作者友情提供的测试服,目前开放免费使用,请勿用于商业用途。
👉 Flash烧录固件(无IDF开发环境)
开发环境
- Cursor 或 VSCode
- 安装 ESP-IDF 插件,选择 SDK 版本 5.3 或以上
- Linux 比 Windows 更好,编译速度快,也免去驱动问题的困扰
AI 角色配置
如果你已经拥有一个小智 AI 聊天机器人,可以参考 👉 后台操作视频教程
详细的使用说明以及测试服的注意事项,请参考 👉 小智测试服的帮助说明。