跳到主要内容

路线图

随着AI模型的准确率的进步和设备性能的提升,可以在本地运行一些模型来解决以往被认为困难的事情。

而语言不通的问题,在可见之年,都是各地区之间沟通的主要阻碍。

DuRT会持续的更新维护下去。

待做任务列表

  • 界面优化 (中高优先级)
  • 优化文件转录结果,如识别准确度、时间戳 (中高优先级)
  • 优化字幕编辑功能 (中优先级)
  • 基于文件的问答、总结等AI功能 (中优先级)
  • 增加Prompt管理功能 (中优先级)
  • 支持macos系统的翻译功能(中优先级)
  • 使用大模型来优化整个流程的结果 (中优先级)
  • 支持AppleScript自动化 (中低优先级)
  • 增加内部音频的来源选择,比如只识别某个app所发出的声音 (低优先级) 不确定是否可以实现
  • 支持非流式whisper模型,支持更多语言的声音识别 (极高优先级)
  • 增加针对本地的视频或音频生成完整字幕文件的功能 (高优先级)
  • 将whisper 变成近乎流式语音识别 (中高优先级)
  • 增加更多的翻译方式,比如各平台的翻译API、各平台的大模型API (中高优先级)
  • 支持macos上的Apple Speech Recognition的识别 (中优先级)
  • 增加服务模型管理界面,抽离服务方便管理 (中优先级)
  • 增加麦克风来源选择, 比如选择耳机的麦克风 (中优先级)
  • 使用whisper自动检测语言,不需要在手动选择语言(中低优先级)

讨论和建议

如果你有更好的想法和建议,可以通过联系我们来与我们沟通。

开源致谢

本项目借鉴了许多开源项目,感谢下面的项目。