基于 AI Coding 「RTC + STT」 Web Demo
文章目录
- 1. 写在最前面
- 1.1 旧测试流程
- 1.2 新测试流程
- 2. Cursor 编程 vs Copilot 编程
- 2.1 coding 速度
- 2.2 coding 正确性
- 3. 碎碎念
1. 写在最前面
为了 Fix 语音转文字(STT)产品在 Json 协议支持上的问题,笔者需要将推送到 RTC 的数据按照正确的格式进行解析,并且确认收到内容符合 Fix 的产品要求。
注:RTC 实时音视频,即 RTC(Real-Time Communication),是一种实时通信技术,它允许计算机、网络设备或移动设备之间进行音频、视频或数据交换。RTC 的核心是交流,强调对语义信息进行高质量和高效率的传递。借助 RTC,用户可以进行基本的音视频通话,实现线上交流的目的。
语音转文字,可以将指定的 RTC 频道的语音识别成对应的文字,并将对应的文字推送回频道,效果参考下图。
1.1 旧测试流程
-
开启一个 RTC 频道
-
针对该频道开启 STT 任务
-
确认 RTC 频道是否有收到 STT 任务识别的结果
1.2 新测试流程
本着优化旧版本测试流程过程的目标 + 刚好过年前期业务压力没有过分紧张,笔者借助「copilot + cursor」的 AI 编程能力,实现了一个支持基于「RTC + STT」的极简版 Web demo。
效果如下:
注:不要问为什么用了两个 AI 编程助手,因为 cursor 免费的体验消耗完成了,但是 demo 还没完成
2. Cursor 编程 vs Copilot 编程
2.1 coding 速度
-
速度
-
Cursor 的问答及 coding 速度,整体上都要比 Copilot 要快,比如笔者问 Cursor 下面的问题,它正确的按照要求完成了功能,并且直接可以运行。尤其是 coding 的速度上, Cursor 使用的是哪里需要修改,就在哪里插入新增代码的方式
-
-
Copilot 的 coding 速度真的让我放弃后面功能继续使用它写,想开个 Cursor 的账户的冲动(想了一下,还是要除夕之后,争取最大价值使用),它的 coding 方式很呆,必须重新覆盖写整个文件,就……,参考下面的问答:
注:公平起见,笔者也让 Copilot 支持类似一个 Web 「button」的功能
2.2 coding 正确性
-
在简单功能的 coding 上 cursor 几乎一遍都对,但是 copilot 偶尔需要问答两次才能给出正确答案。
-
在复杂的功能的 coding 上,比如将转录的内容在 Web 界面上进行展示的功能上, cursor 和 copilot 回答的表现打平。
注:这部分的原因也有可能是笔者问答的不专业,没有正确的给出返回结果的定义,导致 AI coding 的时候,使用了错误结果定义字段,导致转录的结果无法在 Web 上展示
3. 碎碎念
虽然把兴趣作为工作的时候,偶尔会觉得兴趣好像会变得没有那么有趣了,但是保持好奇心真的是所有兴趣最好的老师!
-
任何一个你不喜欢又离不开的地方,任何一种你不喜欢又摆脱不了的生活,就是监狱。如果你感到痛苦和不自由,希望你心里永远有一团不会熄灭的火焰,不要麻木,不要被同化,拼命成为一个有力量破釜沉舟的人。
-
18岁很好,28岁也不差,38岁可能会更好,只要皱纹不长进心里,我们永远风华正茂。