当前位置：首页 > article >正文

Unity 语音转文字 Vosk 离线库

article 2025/2/28 15:29:59

市场有很多语音库，这里介绍Vosk SDK

除了支持untiy外还有原生开发服务器等

注意事项

有可能debug出来的文本是空的，（确保麦克风正常，且索引正确）
分大模型和小模型，小模型给移动端用，大模型给pc端用，小模型识别速度快，但大模型准

安装unity示例demo

自己clone库，unity版本我选的2022.3.42f1c1

https://github.com/alphacep/vosk-unity-asr

下载语音训练文件

小模型42M

https://alphacephei.com/vosk/models/vosk-model-small-cn-0.22.zip

大模型1.3G

https://alphacephei.com/vosk/models/vosk-model-cn-0.22.zip

注意要是下载网速慢，可使用梯子

下载完毕后，将文件copy到工程的StreamingAssets

运行Demo

设置麦克风索引

这里我打印了麦克风信息列表

识别结果已经在Log上了

结尾

有一定的错误率，但只要你说普通话，吐字清晰，基本上很准

这里是根据麦克风实时输入并转成文本。

理论上也可以把MP3 wav等转成文本

或者根据自己的业务需求，做出点击麦克风开始录制，点击结束，再进行识别

一键三联

点赞·留言·收藏

如果可以帮到你，好用的话，记得一键三连。

毕竟博主写文章是靠爱发电，所以爱会消失对不对。

查看全文

http://www.kler.cn/a/504373.html

20.2、主流数据库安全分析与防护

查看 Linux 系统的版本信息

JAVA实现2048小游戏(附源码)

python实现音频文件格式转换(mp3,m4a,wav,wma,aac...)

【数据库系统概论】第5章数据库完整性【!触发器】

【掌握 JavaScript 数组迭代：map 和 includes 的使用技巧】

Windows 正确配置android adb调试的方法

三小时深度学习PyTorch

嵌入式无人机：防止信号被有意干扰入侵策略

pip install transformers教程

Flink集成TDEngine来批处理或流式读取数据进行流批一体化计算（Flink SQL)拿来即用的案例

rk3568 , buildroot , qt ，使用sqlite，动态库，静态库

操作系统八股文学习笔记

STM32 C++编程，怎样使用printf函数从串口输出中文字符

Unreal Engine 5 C++ Advanced Action RPG 七章笔记

unity xrhand 手势识别

vue3 + element-plus + el-table 实现三层嵌套表格（含分页）

Golang学习笔记_24——泛型

多态（2）

闲谭SpringBoot--ShardingSphere分布式事务探究