滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

Hume AI发布情感智能语音大模型Octave，AI语音能否以假乱真？

时间：2025-02-27 20:24:16 来源：ITBEAR编辑：快讯团队 发表评论无障碍通道

在人工智能领域，一次创新性的飞跃近日由美国情感智能技术初创公司Hume AI实现。该公司发布了一款名为Octave的新型文本转语音大模型，该模型能够根据用户输入的提示词或剧本，生成富有人设特点、语调起伏和情感色彩的AI语音，并允许用户通过文本指令进行二次调整和创作。

Hume AI由DeepMind前研究员Alan Cowen于2021年创立，最近一轮融资后估值达到2.19亿美元。在接受采访时，Cowen表示：“我们推出的首个AI文本转语音大模型，能够理解上下文中的词汇，并预测出适当的情绪、节奏、韵律和重音，从而使AI语音听起来比以往更人性化。”

Octave的设计初衷是为了解决过往AI语音生硬、缺乏情感表达的问题。它不仅能够表达愤怒、悲伤或快乐等单一情绪，还能将多种情感交织融合在一起，如“夹杂着幽默或恼怒的轻度沮丧”。这种能力使得Octave非常适合用于有声读物、播客、视频画外音和视频游戏角色配音等预先制作的内容。

Hume AI在社交媒体上发布的信息显示，Octave的训练数据量是传统文本转语音大模型的1000倍，这包括数百万小时的公开长篇语音数据和Hume AI独家采集的声音、视频数据。这种庞大的数据集使得Octave能够理解剧本，并使用更逼真的情感、语义、节奏、词语和重音等要素。

除了文本转语音功能，Octave还具备语音设计、表演指令和即将上线的语音克隆功能。在语音设计方面，Octave能够基于提示词或剧本生成各种设定的AI语音，包括人称代词、简称、用词等，从而生成与角色相符的连贯语音内容。在表演指令功能中，用户可以基于现有语音类型，用指定的情感或说话风格来朗读新剧本。而语音克隆功能则只需一段5秒的音频，就能快速克隆出相应的语音。

在一项人类评审盲测的对比实验中，Octave的输出在音质、自然度以及语音生成与预期描述匹配度等方面均优于ElevenLabs，这表明其AI语音生成过程的可控性和生成质量均高于行业水准。

目前，Octave已在Hume AI的平台和API上线，支持超过40种预设语音的语音库，以及用于生成有声书、播客等长篇内容的项目界面（预览版）。开发者可以通过Python和Type SDK访问Octave，这些SDK会处理身份验证，并提供类型化接口以确保集成的可靠性。命令行界面支持快速原型设计、测试以及直接从终端批量处理。

Hume AI的收费方式采用订阅制，分为免费、入门版、Creator和专业版等多个级别。免费版提供每月1万个字符的文本转语音服务，总时长约10分钟，并允许无限自定义声音。其他版本则提供更多的字符数和时长，以及额外的项目支持和优惠价格。

Octave的发布标志着AI语音技术向更加人性化和情感化的方向迈出了重要一步。它不仅有望解决AI语音应答机械、语调生硬的问题，还能为影视、视听、新媒体、数字人等多个行业提供定制化的配音服务，加速AI语音的商业化落地。

举报 0 收藏 0 打赏 0评论 0

更多>同类资讯

RunningHub携FramePack插件，开启长视频创作无硬件限制新纪元

04-18

闲鱼AI新突破：超级智能体引领闲置交易革命

04-18

用友BIP新品重磅发布：智驱制造，助力企业质优本降效增！

04-18

联想创新科技大会：揭秘AI新品，人形机器人或成数字生活新桥梁？

04-18

食博会·预博会和农博会东莞启幕，AI智慧农食展新风采！

04-18

测测达人携手FARMER BOB：春日治愈行动，让情绪找到回响

04-18

闪迪创作者系列全新上市，专业存储方案赋能内容创作者高效产出

04-18

AI造游戏，路还长吗？

04-18

智谱AI获多方青睐，北京基金再追投2亿助力开源生态建设

04-18

智平方AlphaBot 2升级亮相：DeepSeek技术赋能，开启通用智能新篇章

04-18

谷歌Gemini 2.5 Flash突破性发布：成本大幅降低，性能依旧强劲

04-18

关税风暴中，全球AI产业如何破局前行？

此外，由于对等关税大棒给全球经济体都造成了冲击，由此产生对美国技术生态体系的不信任，或许也是一个中国AI合纵连横的窗口期，来增强中国AI技术生态的韧性，比如，吸引海外开发者使用国产化AI框架、开发工具、AI…

04-18

银行业科技投入分化，大模型应用深度融入核心业务成亮点

对此，钛媒体App重点梳理了10家银行（包括国有六大行和招行、中信、平安、兴业4家股份行）财报，以此一窥国内头部银行的最新科技故事。总的来说，虽然智能客服、代码助手等已是普遍应用，但上述银行在专业领域的深…

04-18

讯飞双屏翻译机2.0新品发布：智能升级，让跨境沟通无界高效！

04-18

萝卜快跑海南布局再落一子，新公司注册资本达百万

04-18

点击查看更多 +

全站最新

宝马中国CEO高翔上海车展前瞻：新世代战略与安全坚守并重

雷克萨斯独资建厂，能否在新能源赛道上重塑辉煌？

海陆空全能王！比亚迪海狮07DM-i智驾版预售仅18.98万起

长安Lumin 2025款双车升级，A00纯电市场迎来新标杆！

一加13T小屏新体验：李杰力赞单手操作无压力

零刻ME mini迷你机首发，搭载英特尔N200，六盘位存储仅售1295元！

热门内容

本栏最新

闲鱼AI新突破：超级智能体引领闲置交易革命

用友BIP新品重磅发布：智驱制造，助力企业质优本降效增！

联想创新科技大会：揭秘AI新品，人形机器人或成数字生活新桥梁？

食博会·预博会和农博会东莞启幕，AI智慧农食展新风采！

测测达人携手FARMER BOB：春日治愈行动，让情绪找到回响

闪迪创作者系列全新上市，专业存储方案赋能内容创作者高效产出

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.