一款利用Google语音识别生成自动转录/自动字幕的开源软件-pyTranscriber

简介:
pyTranscriber是一个应用程序,可用于通过友好的图形用户界面为音频/视频文件生成自动转录/自动字幕。Google语音识别API使用Autosub进行了语音识别的艰苦工作。 pyTranscriber是我以前的项目JAutosub(Java)的改进版本,由于在单个项目中混合使用这两种不同语言的局限性,问题和开销而创建的。 默认情况下,该应用在用户界面上将字幕输出为.srt和转录的音频以及.txt文件。可以使用Aegisub编辑SRT文件。提醒:需要可连接Google的网络
pyTranscriber
Google Cloud Speech Server的工作方式与YouTube自动字幕相同。

重要提示:由于语音识别技术仍不能完全准确,因此结果的准确度可能会有所不同,这取决于许多因素,主要是音频的质量/清晰度。理想情况下,音频输入不应具有背景噪音,声音效果或音乐。如果只有一个说话者,并且他说话的速度清晰而缓慢,则表示识别会更加准确。有时,在理想/幸运的条件下,可以获得接近95%的准确度结果。
Google Cloud Speech Server
下载Windows / Linux / MacOS便携式应用程序
https://github.com/raryelcostasouza/pyTranscriber/releases/tag/v1.4-stable

Last modification:April 22nd, 2020 at 10:02 pm
If you think my article is useful to you, please feel free to appreciate

Leave a Comment