【ITBEAR科技资讯】9月12日消息,数字阅读领域的一项令人振奋的合作计划正式亮相。微软与知名的数字图书馆项目"Project Gutenberg"达成合作,旨在通过人工智能技术为读者提供全新的有声书体验。
微软的这一项目融合了机器学习、自动文本选择和自然语音合成等多项AI技术,以实现电子书的自动转化为语音。首先,项目团队开发出一种先进的算法,能够智能分析电子书的结构,准确识别正文内容并区分出页码、表格等非关键元素。接着,他们运用WaveNet、Tacotron和FastSpeech等文本转语音技术,生成极为自然的朗读语音。最引人注目的是,该系统还具备了智能识别书中不同部分,包括叙述、对话和不同角色的能力,可以根据情节调整语音表达,使故事更具生动感。
据ITBEAR科技资讯了解,微软的这一计划已经积累了超过35000小时的有声书语音数据,涵盖了各类经典文学、戏剧、传记等作品。所有这些宝贵的语音资源将以开源方式免费提供给广大读者。此外,用户还可以将自己的声音应用于有声书制作,实现个性化的朗读体验。这一举措不仅丰富了数字阅读资源,也为视障人士提供了更为便捷的阅读方式,为文学与科技的结合开辟了新的可能性。