【ITBEAR科技资讯】3月8日消息,谷歌正朝着建立一个支持1000种不同语言的人工智能语言模型的目标迈进。在周一发布的更新中,谷歌分享了有关通用语音模型(USM)的更多信息,谷歌将这一系统描述为实现其目标的 "关键第一步"。
谷歌的USM语音模型是一个支持多种语言的语音识别系统,该系统使用了大量的数据和先进的机器学习技术进行训练。该模型的目标是支持全球1000种最常用语言的语音识别,目前已经支持超过100种语言。该技术的一个应用可能是在增强现实眼镜内提供实时翻译服务,不过该技术目前仍处于早期阶段,存在一些错误和不足之处。
据ITBEAR科技资讯了解,谷歌在去年11月宣布了该计划,同时还披露了其USM模型。该模型有20亿个参数,在1200万小时的语音和超过300种语言的280亿个句子中进行训练。现在,谷歌表示USM已经支持超过100种语言,并将作为 "基础 "来建立一个更加广泛的系统。
目前,该技术的一个目标是在增强现实眼镜内提供实时翻译服务。不过,该技术目前仍有一些不足之处,谷歌在I/O大会期间对阿拉伯语的错误表述证明了它是多么容易出错。不过,该技术对于支持多种语言的应用程序和服务具有很大的潜力,将会在未来得到越来越广泛的应用。