【ITBEAR科技资讯】7月20日消息,ElevenLabs于昨日(7月19日)通过博文向世界宣布,他们已成功推出全新的Turbo v2.5文本到语音AI模型。这款新模型支持包括普通话在内的32种语言,覆盖了全球近80%的地区,为用户提供高品质、低延迟的AI对话体验。
Turbo v2.5模型的一个显著特点是新增了对越南语、匈牙利语和挪威语的支持。这三种语言分别被8500万、1300万和530万人使用,此举无疑将ElevenLabs的AI服务扩展到了更广泛的用户群体。
据ITBEAR科技资讯了解,此次更新不仅增加了新的语言支持,还显著提高了印地语、法语、西班牙语、普通话等27种语言的响应速度,其中最高提升了3倍,英语的响应速度也提高了25%。这一改进得益于Turbo v2.5模型融合了尖端的文本到语音技术和最新的低延迟模型架构,使得用户能够在几乎无需等待的情况下获得高质量的AI生成音频。
Turbo模型的快速语音合成功能,在保持音质流畅自然的同时,响应时间控制在400毫秒以内,为用户提供了极佳的交互体验。
ElevenLabs,这家总部位于伦敦的公司,自2022年成立以来,一直致力于开发先进的人工智能语音模型和工具。他们的服务能够创建不同语言、口音和情感的合成语音,极大地丰富了AI语音的应用场景。
公司CEO Mati Staniszewski透露,ElevenLabs目前拥有一支由约40名分布在全球的远程办公员工组成的团队,并计划在年底前将团队规模扩大至100人。
在推进AI技术的同时,ElevenLabs也非常重视人工智能内容的透明度。他们开发了如AI Speech Classifier等工具来辅助识别合成音频,同时还在积极探索电影配音等新的应用领域。更令人期待的是,他们正在开发一个平台,允许用户生成AI语音并通过授权获得收益,这无疑为AI语音技术的发展开辟了新的商业模式。