Google在今年2月推出名为「即时转录 (Live Transcribe)」的语音工具,让使用者能即时将口说或播放的语句内容快速识别转换为文字内容,让听力有问题的人也能快速知晓。而在稍早时候,Google更进一步将此项语音工具开源,让更多开发者能藉此打造便利的应用工具。

「即时转录」的技术源自Google Cloud Platform所提供的Cloud Speech API,除了藉由云端协同运算提高语音内容识别精準度,同时也能藉由Android装置进行前期运算,让实际识别转换效果更好。

其实在今年準备释出正式版本更新的Android Q (10.0)所搭载的Live Caption功能,在背后运作其实也採用相同运作模式,但可藉由Android装置进行简单运算,即便在没有连网情况下也能完成一定程度的语音内容识别、转换,而配合连网运作则可让实际识别正确率提高,同时也能以更快效率完成转换。

目前Google进一步将「即时转录」工具编码内容开源,自然希望能藉由更多开发者已此打造更丰富的实用语音工具。

而为了让「即时转录」有更好应用表现,Google更进一步降低背后需要使用网路频宽,在不影响识别转换精準度情况下,约让网路频宽使用量缩减为原本的10%,同时为了让即时语音识别效率提昇,并且减少反应延迟表现,Google也藉由自订Opus编码器降低延迟问题。

在现阶段里,「即时转录」已经支援中文、日文、英文在内70种语言,但部分语言在内容识别仍有其侷限,例如日文暂时还难以判断完整语句的结尾,因此实际辨识结果可能会变成所有语句均连接在一起,难以分辨前后句的情况。

你也许会想看以下内容:Android…华为投入人工智慧应用处理器研发…Google…分享此文:分享到 Twitter(在新视窗中开启)按一下以分享至 Facebook(在新视窗中开启)点这里列印(在新视窗中开启)点这里寄给朋友(在新视窗中开启)请按讚:喜欢 载入中...识别google即时语音藉由转录工具转换视窗