当前位置: 首页 > article >正文

Unity 语音转文字 Vosk 离线库

市场有很多语音库,这里介绍Vosk SDK 

除了支持untiy外还有原生开发服务器等

目录

  1. 安装unity示例demo
  2. 下载语音训练文件
  3. 运行demo
  4. 结尾
  5. 一键三联

注意事项

  1. 有可能debug出来的文本是空的,(确保麦克风正常,且索引正确)
  2. 分大模型和小模型,小模型给移动端用,大模型给pc端用,小模型识别速度快,但大模型准

安装unity示例demo

自己clone库,unity版本我选的2022.3.42f1c1

https://github.com/alphacep/vosk-unity-asr

下载语音训练文件

小模型42M

https://alphacephei.com/vosk/models/vosk-model-small-cn-0.22.zip

大模型1.3G

https://alphacephei.com/vosk/models/vosk-model-cn-0.22.zip

注意要是下载网速慢,可使用梯子

下载完毕后,将文件copy到工程的StreamingAssets

运行Demo

设置麦克风索引

这里我打印了麦克风信息列表

识别结果已经在Log上了

结尾

有一定的错误率,但只要你说普通话,吐字清晰,基本上很准

这里是根据麦克风实时输入并转成文本。

理论上也可以把MP3 wav等转成文本

或者根据自己的业务需求,做出点击麦克风开始录制,点击结束,再进行识别

  一键三联

点赞·留言·收藏

如果可以帮到你,好用的话,记得一键三连。

毕竟博主写文章是靠爱发电,所以爱会消失对不对


http://www.kler.cn/a/504373.html

相关文章:

  • 《零基础Go语言算法实战》【题目 2-30】并发安全问题
  • Sonatype Nexus OSS 构建私有docker 仓库
  • 软件设计模式的原则
  • Android string.xml中特殊字符转义
  • 【2025最新】机器学习类计算机毕设选题80套,适合大数据,人工智能
  • 数仓建模(五)选择数仓技术栈:Hive ClickHouse 其它
  • 20.2、主流数据库安全分析与防护
  • 查看 Linux 系统的版本信息
  • JAVA实现2048小游戏(附源码)
  • python实现音频文件格式转换(mp3,m4a,wav,wma,aac...)
  • 【数据库系统概论】第5章 数据库完整性【!触发器】
  • 【掌握 JavaScript 数组迭代:map 和 includes 的使用技巧】
  • Windows 正确配置android adb调试的方法
  • 三小时深度学习PyTorch
  • 嵌入式无人机: 防止信号被有意干扰入侵策略
  • pip install transformers教程
  • Flink集成TDEngine来批处理或流式读取数据进行流批一体化计算(Flink SQL)拿来即用的案例
  • rk3568 , buildroot , qt ,使用sqlite, 动态库, 静态库
  • 操作系统八股文学习笔记
  • STM32 C++编程,怎样使用printf函数从串口输出中文字符
  • Unreal Engine 5 C++ Advanced Action RPG 七章笔记
  • unity xrhand 手势识别
  • vue3 + element-plus + el-table 实现三层嵌套表格(含分页)
  • Golang学习笔记_24——泛型
  • 多态(2)
  • 闲谭SpringBoot--ShardingSphere分布式事务探究