滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

出门问问TicVoice 7.0：新一代TTS引擎，让AI语音更自然更有情

时间：2025-03-07 16:26:57 来源：ITBEAR编辑：快讯团队 发表评论无障碍通道

在人工智能语音技术的前沿探索中，出门问问携手香港科技大学、上海交通大学、南洋理工大学及西北工业大学等顶尖学府，共同推出了一项开创性的成果——新一代语音生成模型Spark-TTS，并随之发布了其商业化版本TicVoice 7.0，这一举动标志着语音合成技术迈入了一个崭新的阶段。

TicVoice 7.0，作为出门问问第七代文本转语音（TTS）引擎，其独特之处在于能够摒弃传统多阶段、多流生成模型的依赖，仅凭单一的语言模型（序列猴子）以简洁的单阶段、单流方式高效完成TTS生成。这一革新不仅赋予了TicVoice 7.0超自然的语音克隆与跨语种生成能力，还允许用户根据个人需求定制专属声音，为个性化语音服务树立了新的标杆。

出门问问已将TicVoice 7.0应用于其AI配音产品“魔音工坊”，显著提升了用户体验。凭借领先的3秒语音克隆技术和卓越的精品发音人定制效果，魔音工坊在客服、有声书、情感直播、影视解说及配音等多个应用场景中展现了非凡的表现力，为用户带来了前所未有的听觉盛宴。

Spark-TTS模型一经发布，便迅速在Hugging Face趋势榜上占据TTS领域前列，其增长势头强劲，同时伴随相关论文的发布，在学术界也引发了广泛关注和热烈讨论。Spark-TTS之所以能引起如此反响，关键在于它引入了全新的语音编码范式，实现了建模结构与文本大型语言模型（LLMs）结构的高度统一，为行业带来了革命性的变化。

针对主流语音token存在的痛点，TicVoice 7.0与Spark-TTS提出了一种创新的BiCodec编码方式，将语音编码为Global Token和Semantic Tokens两部分，分别负责建模全局特征和语义相关信息。这种设计不仅简化了模型结构，还提高了音色等属性的精准控制，实现了高效性与可控性的完美结合。

在语音克隆能力方面，TicVoice 7.0再次刷新了行业标准，尤其在跨语言声音克隆上表现卓越。与上一代产品MeetVoice Pro及国内外同类产品相比，TicVoice 7.0在“3秒克隆”和“至臻Pro-精品发音人”定制方面展现出明显优势。其国际通用MOS评分从3.9提升至4.2，音色相似度、情感表现及稳定性均有显著提升，为用户带来了更加自然、悦耳、稳定的听觉体验。

TicVoice 7.0还支持用户通过调整性别、语速、基频等多种属性（即将上线）来精准定制独特的声音风格。在“至臻Pro-精品发音人”定制服务中，用户仅需提供20至200句语料，即可获得播音级的专业配音体验。其国际通用MOS分数从4.3提升至4.7，语音效果达到了广播级水平，为影视、游戏角色配音等场景提供了专业级的定制服务。

出门问问自2012年成立以来，一直致力于人工智能语音技术的研发与应用，不断迭代升级TTS引擎。通过深厚的技术积累和先进的产品应用经验，出门问问成功推出了“魔音工坊”、“奇妙元”、“元创岛”等一系列语音产品或搭载语音功能的产品，稳固了其在行业内的技术与产品领先地位。此次Spark-TTS的开源与TicVoice 7.0的发布，不仅展现了出门问问在语音生成领域的又一次重大突破，更为行业的发展注入了新的活力与动能。

举报 0 收藏 0 打赏 0评论 0

更多>同类资讯

高通收购Edge Impulse，加码AI与物联网布局，战略再升级！

03-11

智元机器人发布通用基座大模型GO-1，新人形机器人亮相在即

具体来说，VLM作为通用具身基座大模型的主干网络，继承开源多模态大模型5-2B的权重，利用互联网大规模纯文本和图文数据，让智元机器人的Genie Operator-1（GO-1）具备了通用的场景感知和理解能…

03-11

智元机器人新成员灵犀X2：多模态交互，毫秒级响应，未来生活新助手？

03-11

CoreWeave牵手OpenAI豪掷119亿，IPO前夕能否一飞冲天？

03-11

智元机器人新推灵犀X2：运动交互作业全能，灵动机器人来了！

03-11

智元机器人“灵犀X2”：双足交互，情感计算，灵动新体验！

03-11

DeepSeek超越开源大模型，但开源治理风险如何解？阿里研究院发声

日前，阿里研究院文章称，DeepSeek是对开源大模型价值的强有力支持。正是站在LLaMa、千问等开源大模型的基础上，DeepSeek通过更巧妙的工程设计挖掘了大模型的内在潜力、实现了性能上的超越。但另一方面…

03-11

小米人形机器人CyberOne量产计划真相如何？官方回应引猜测

03-11

索尼开发AI游戏角色原型：埃洛伊能与玩家实时对话互动

03-11

智元机器人发布通用基座大模型GO-1，新人形机器人亮相在即

具体来说，VLM作为通用具身基座大模型的主干网络，继承开源多模态大模型5-2B的权重，利用互联网大规模纯文本和图文数据，让智元机器人的Genie Operator-1（GO-1）具备了通用的场景感知和理解能…

03-11

Manus引爆AI Agent竞赛，通用智能体时代加速到来？

而且，Manus也不需要像AIAgent程序员Devin一样，针对不同场景进行针对性设定，而是说一句话就能启动不同领域的任务，让人们使用AI的效率得到了提升。但在Manus，用户说出一个需求，就会有Ag…

03-11

苹果悄然下架iPhone 16“AI Siri”广告，开发进度滞后引关注

据报道，去年秋季，苹果公司宣传iPhone 16和Apple Intelligence时，曾展示了“AISiri”的广告，但是因该功能短期内不会推出后，这条广告目前已被撤下。据悉，该广告由贝拉拉姆齐主演。…

03-11

OpenAI新招CoT监控：为大模型恶意行为戴上“紧箍咒”

03-11

智元机器人发布通用基座大模型GO-1，新人形机器人即将亮相！

具体来说，VLM作为通用具身基座大模型的主干网络，继承开源多模态大模型5-2B的权重，利用互联网大规模纯文本和图文数据，让智元机器人的Genie Operator-1（GO-1）具备了通用的场景感知和理解能…

03-11

智元启元大模型GO-1发布，具身智能迈向新高度，新人形机器人即将亮相！

具体来说，VLM作为通用具身基座大模型的主干网络，继承开源多模态大模型5-2B的权重，利用互联网大规模纯文本和图文数据，让智元机器人的Genie Operator-1（GO-1）具备了通用的场景感知和理解能…

03-11

点击查看更多 +

全站最新

美光1γ DDR5内存新突破：减少EUV使用，能否加速尖端DRAM量产？

途昂Pro震撼上市，黄金动力组合与豪华配置引领智能SUV新风潮

“福远渔9199号”启航！全国最大南极磷虾捕捞加工船扬帆远航

吉利银河翼真L380上市，高端MPV新标杆，售价29.99万起

微星MEG Ai1600T PCIE5钛金电源将上市，售3999元享终身质保

Meta携手雷朋推出限量透明智能眼镜，时尚与科技完美碰撞！

热门内容

本栏最新

高通收购Edge Impulse，加码AI与物联网布局，战略再升级！

智元机器人发布通用基座大模型GO-1，新人形机器人亮相在即

智元机器人新成员灵犀X2：多模态交互，毫秒级响应，未来生活新助手？

智元机器人新推灵犀X2：运动交互作业全能，灵动机器人来了！

小米人形机器人CyberOne量产计划真相如何？官方回应引猜测

索尼开发AI游戏角色原型：埃洛伊能与玩家实时对话互动

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.