使用教程
目前DuRT具有实时语音识别、实时识别结果翻译、支持录音、保存识别结果、识别时复制到剪切板、保存翻译结果,等功能。
这篇文档是关于如何使用DuRT,包括使用前的注意事项和DuRT的主要功能。
语音识别
DuRT目前集成了三种主流的语音识别方式,流式语音识别、非流式语音识别和Apple系统内的语音识别。
下面先给出三种语音识别方式的对比。
识别方式 | 流式 | 非流式 | Apple |
---|---|---|---|
识别效果 | 不错 | 好 | 好 |
下载模型 | 流式识别模型 | Whisper模型 | 不需要下载模型 |
标点符号 | 不支持 | 支持 | 支持 |
识别速度 | 实时 | 近乎实时 | 实时 |
支持语言 | 4 | 30+ | 30+ |
识别过程中切换语言 | 不支持 | 支持 | 支持 |
仅在本地运行 | 是 | 是 | 分情况 |
翻译 | 支持 | 支持 | 支持 |
保存录音 保存识别结果 保存翻译结果 | 支持 | 支持 | 支持 |
三种语音识别效果, 我感觉Apple和Whisper非流式识别效果好。不同的语言会有不同的准确度,可以尝试这三种方式。
权限申请
在使用语音识别时,需要首先设置权限。目前DuRT支持识别设备内语音和麦克风语音。
对于识别设备内音频需要录屏与系统录音权限,需要在设置>隐私与安全>录屏与系统录音,中允许DuRT使用录屏与系统录音。 如下图:
对于识别麦克风语音需要麦克风权限,需要在设置>隐私与安全>麦克风,中允许DuRT访问麦克风。 如下图:
保存录音、识别结果、翻译结果需要选择某个目录作为存放的位置,需要在DuRT内的设置页面,设置保存目录。
同时防止权限滥用, DuRT只会在识别运行时,使用录屏或者麦克风权限。