跳到主要内容

介绍

欢迎来到DuRT的官方网站。

DuRT名字的寓意是Du(Do) Speech Recognition and Translation in Real-Time。即实时识别语音并翻译。

使用场景

DuRT是实时识别设备内外语音,将语音转成文字,并翻译成指定的语言。 设备内外的语音是指设备内播放的语音、麦克风接收到的语音。

看网上在线视频时,不再被听不懂、不明白什么意思所困扰。DuRT实时识别视频中的语音,并转成你的母语,可以立刻明白是什么意思。

在线上授课、线上会议时,使用DuRT实时理解对方的话,也可在事后再次听录音、看识别后的文本。

在看本地视频时,不需要再去找双语字幕,使用DuRT实时翻译视频中的语音,理解视频的内容。

DuRT支持保存录音、识别结果和翻译结果。

安装

从Mac App Store 安装

Example banner

主要功能

语音识别

DuRT实时识别设备内外语音,将语音转成文字。并以悬浮框的形式滚动展示。 如下图:

Image description

目前DuRT的语音识别分为流式语音识别非流式语音识别Apple识别

流式语音识别会实时将语音转成文字。 非流式语音识别在几秒延迟(可设置)后,将语音转成文字, 做到近乎流式识别。 Apple识别使用MacOS系统中的语音识别功能,实时将语音转成文字。

流式语音识别支持四种语言:英语、汉语、韩语、法语。

非流式语音识别支持语言:阿拉伯语、保加利亚语、加泰罗尼亚语、中文、克罗地亚语、捷克语、丹麦语、荷兰语、英语、芬兰语、法语、加利西亚语、德语、希腊语、意大利语、日语、韩语、马其顿语、波兰语、葡萄牙语、罗马尼亚语、俄语、斯洛伐克语、西班牙语、瑞典语、泰米尔语、泰语、土耳其语、乌克兰语、乌尔都语、越南语。

Apple识别支持阿拉伯语、粤语、加泰罗尼亚语、克罗地亚语、捷克语、丹麦语、荷兰语、英语、芬兰语、法语、德语、希腊语、希伯来语、印地语、匈牙利语、印度尼西亚语、意大利语、日语、韩语、马来语、普通话、波兰语、葡萄牙语、罗马尼亚语、俄语、上海话、斯洛伐克语、西班牙语、瑞典语、泰语、土耳其语、乌克兰语和越南语。

通过综合和比较这三种方式,可以选择出最适合你的方式。

文本翻译

DuRT支持文本翻译。通过运行本地AI模型,将语音识别后的文字进行翻译,并以悬浮框的形式滚动展示。 如下图:

Image description

目前支持语言: 阿拉伯语、保加利亚语、加泰罗尼亚语、中文、克罗地亚语、捷克语、丹麦语、荷兰语、英语、芬兰语、法语、加利西亚语、德语、希腊语、意大利语、日语、韩语、马其顿语、波兰语、葡萄牙语、罗马尼亚语、俄语、斯洛伐克语、西班牙语、瑞典语、泰米尔语、泰语、土耳其语、乌克兰语、乌尔都语、越南语。

保存音频、识别文本

在开始识别之前,选择对应的功能,可以保存整个识别过程的声音、识别后的文本、识别后的文本翻译后的文本。

复制识别时的文本

点击悬浮框中的文本,出现红色选中状态,文本就已经被复制到剪切板中, 按command+v粘贴到其他地方即可。 如下图:

Image description

硬件系统要求

目前只有Mac电脑版本,需要MacOS 13.0+, 仅支持Apple芯片,即M系列。

流式识别和非流式识别需要下载AI模型,并且运行时需要占用内存,所占内存大概为模型大小的2-3倍。 Apple识别由于使用的是MacOS自带的功能,所以在运行时不需要占用内存。

翻译功能需要下载AI翻译模型,并且运行时需要占用内存,所占内存大概为1.5g内存。

绝大多数的Mac M系列电脑都有8g以上内存,都可以满足这个内存需求。