YouTube近日宣布,其自动配音功能已正式向更多频道开放,这一创新技术使得视频创作者能够为他们的内容生成多语言翻译音频。此前,这项功能仅限于少数创作者进行内部测试。
早在去年,YouTube在Vidcon大会上便首次展示了这一基于AI技术的自动配音工具,旨在帮助全球观众更轻松地理解平台上的丰富内容。目前,YouTube已将这一功能推广至其合作伙伴计划中的数十万个知识类和信息类频道,并计划在未来进一步扩展至更多内容类型。
创作者只需按照常规流程上传视频,YouTube便会自动识别视频中的语言,并为其生成多种语言的配音版本。目前,这一工具已支持英语、法语、德语、印地语、印尼语、意大利语、日语、葡萄牙语和西班牙语,极大地拓宽了内容的受众范围。
YouTube的自动配音功能采用了谷歌的Gemini技术来模拟人类语音。然而,YouTube也坦诚地指出,这项技术仍处于初期阶段,可能并不完美。在某些情况下,翻译或配音效果可能存在一定的瑕疵。尽管如此,这一功能仍然为创作者提供了一个强大的工具,以跨越语言的障碍,与全球观众建立联系。
YouTube还透露,另一个名为“表现性语音”的功能即将上线。这一功能旨在更好地模拟创作者的语气、情感和周围环境氛围,使配音更加生动自然。为了不断提升配音的准确性和生动性,YouTube宣布将继续与Google DeepMind和Google Translate团队合作,推出更多尖端技术。