京东言犀近期宣布推出LiveTTS语音合成大模型及升级版的通用数字人大模型2.0,这两项技术革新将显著提升人机交互的自然流畅度。新版本不仅支持零样本音色复刻与精细音色调整,还实现了更精确的数字人声与唇动的同步,为用户带来更加逼真的交互体验。
在业界知名的SeedTTS test-hard测试中,LiveTTS的表现尤为亮眼,其字符错误率(CER)相较于其他主流厂商的模型有了显著下降,降低幅度在0.2%至5.12%之间。这意味着,在长达一万字的文本朗读中,LiveTTS能够减少最多达512次的发音错误,极大地提升了语音合成的准确性和流畅性。
京东言犀的这项技术已经针对多个商业化场景进行了深度优化,包括但不限于直播、外呼服务、客服互动以及营销活动等,覆盖了超过10种不同的应用场景。这一广泛的适用性,无疑将极大地拓宽LiveTTS及数字人大模型2.0的应用范围和市场潜力。
通过LiveTTS及数字人大模型2.0的引入,京东言犀旨在为用户提供更加自然、高效的人机交互解决方案。无论是在线直播中的实时互动,还是客户服务中的语音应答,亦或是营销活动中的个性化推广,这些技术都将为用户带来前所未有的沉浸式体验。
随着技术的不断成熟和应用场景的不断拓展,京东言犀的LiveTTS及数字人大模型2.0有望在人机交互领域掀起一场革命性的变革。未来,我们有理由期待这些技术将在更多领域发挥重要作用,为用户带来更加便捷、智能的生活体验。