滚动资讯

当前位置：首页 > 资讯 > 业界动态 > 正文内容

亚马逊发布Nova Sonic语音模型，挑战OpenAI与谷歌前沿技术

时间：2025-04-09 12:28:31 来源：ITBEAR编辑：快讯团队 发表评论无障碍通道

亚马逊近日震撼发布了一款名为Nova Sonic的先进生成式AI语音模型，该模型能够直接处理并生成自然流畅的语音，标志着亚马逊在AI语音技术上的重大突破。

据悉，Nova Sonic在速度、语音识别及对话质量等核心指标测试中，展现出了与OpenAI和谷歌顶尖语音模型相抗衡的实力。这一成就不仅是亚马逊对诸如ChatGPT语音模式等新兴AI语音模型的有力回应，也预示着AI语音交互新时代的到来。

相较于亚马逊早期的Alexa模型，Nova Sonic在语音交互上更加自然流畅，为用户带来了全新的体验。通过亚马逊的Bedrock开发者平台，用户可轻松接入Nova Sonic，该平台专为构建企业级AI应用而设计。Nova Sonic采用了一个创新的双向流式API，进一步提升了其应用灵活性和便捷性。

亚马逊在新闻稿中自豪地宣称，Nova Sonic是市场上“最具成本效益”的AI语音模型，其价格相比OpenAI的GPT-4o模型便宜了约80%。这一价格优势无疑将吸引更多开发者选择Nova Sonic作为他们的AI语音解决方案。

据亚马逊高级副总裁兼人工通用智能（AGI）部门首席科学家罗希特·普拉萨德介绍，Nova Sonic的部分组件已经为亚马逊升级版数字语音助手Alexa+提供了强大动力。普拉萨德还表示，与竞争对手的AI语音模型相比，Nova Sonic在路由用户请求到不同API方面表现出色，能够智能地判断何时需要从互联网获取实时信息、解析专有数据源或在外部应用程序中采取行动。

在双向对话场景中，Nova Sonic展现出了极高的智能性。它会等待“合适的时机”发言，充分考虑说话者的停顿和打断等情况，使得对话更加自然流畅。Nova Sonic还能为用户的语音生成文本记录，这些文本记录可被开发者用于各种应用场景，进一步拓展了其应用潜力。

在语音识别方面，Nova Sonic同样表现出色。据普拉萨德介绍，Nova Sonic的语音识别错误率比其他AI语音模型更低，即使在用户咕哝、说错话或处于嘈杂环境中时，也能准确理解用户的意图。在一项跨语言和方言的语音识别基准测试——多语言LibriSpeech中，Nova Sonic在英语、法语、意大利语、德语和西班牙语上的平均单词错误率（WER）仅为4.2%，这一成绩令人瞩目。

在衡量多人参与的高音量互动基准测试——增强多方互动中，Nova Sonic也展现出了卓越的性能。亚马逊称，Nova Sonic在单词错误率方面比OpenAI的GPT-4o-transcribe模型准确率高出46.7%。同时，Nova Sonic还拥有行业领先的速度，其平均感知延迟为1.09秒，比OpenAI为实时API提供动力的GPT-4o模型更快。

Nova Sonic的发布是亚马逊构建人工通用智能（AGI）这一更广泛战略的重要组成部分。普拉萨德表示，亚马逊计划推出更多能够理解不同模态（包括图像、视频和语音）的AI模型，以及“其他在将事物引入物理世界时相关的感官数据”。这一战略无疑将推动亚马逊在AI领域的持续创新和领先。

举报 0 收藏 0 打赏 0评论 0

更多>同类资讯

三星2纳米芯片Exynos 2600量产在即，良率提升至40%能否缩小与台积电差距？

04-12

谷歌Pixel Watch 4曝光：边框收窄，电池升级，双按键引猜想

近期，科技界再度迎来热议话题，谷歌Pixel Watch系列即将迎来新成员——Pixel Watch 4。这款智能手表作为Pixel Watch 3的升级之作，不仅在设计与性能上进行了全面革新，更致力于为用户带来前所未有的使用体验。从曝光的渲染图来看，Pixel Watch 4依旧沿用了前代产品的圆

04-12

福田新能源企业出海新航道：一站式服务平台引领全球化征程

04-12

中国航天科技集团一日三捷，火箭卫星发动机试验齐传佳音

04-12

GNOME Weather紧随Decibels，成GNOME第二款采用TypeScript核心应用

04-12

黑洞“Ansky”苏醒，释放百倍能量X射线，刷新科学认知

04-12

字节跳动VAPO框架刷新AIME24记录，大型语言模型推理能力大幅提升

04-12

老挝首飞！国产C909客机开启商业新征程

04-12

OpenAI安全测试时间大幅缩水，AI竞赛背后隐患几何？

04-12

京东外卖“百亿补贴”战，能否撬动外卖市场格局？

造势充足，多番确证做外卖并非“玩票”，上线两个月以来商家供给、履约配送也逐渐成形，但最关键的一环仍是，消费者们对这一切的感知如何。电商语境下的百补活动中，平台不能说形成了领先于行业的低价心智，轰轰烈烈的自…

04-12

Win11更新现“inetpub”文件夹，微软警告：勿删，系安全补丁关键一环

04-12

vivo X200 Ultra配置大揭秘：6000mAh电池搭配8.69mm超薄机身

04-12

荣耀GT Pro曝光：旗舰级双扬声器加持，性能旗舰新体验？

04-12

谷歌新动向：“Circle Screen”功能或将实现屏幕内容精准搜索？

04-12

Proton Mail移动版大升级，离线阅读、高效搜索等新功能来袭！

04-12

点击查看更多 +

全站最新

三星2纳米芯片Exynos 2600量产在即，良率提升至40%能否缩小与台积电差距？

荣耀400系列新机曝光：荣耀400 Pro搭载2亿像素直屏来袭！

ColorWare打造蜡笔风Apple Pencil Pro，客制化设计售215美元

联想moto新品曝光：Loop Earbuds耳机与Watch Fit智能手表即将面世？

谷歌Pixel Watch 4曝光：边框收窄，电池升级，双按键引猜想

上汽之夜：重构汽车产业价值链，中国车企如何领航未来？

热门内容

本栏最新

三星2纳米芯片Exynos 2600量产在即，良率提升至40%能否缩小与台积电差距？

谷歌Pixel Watch 4曝光：边框收窄，电池升级，双按键引猜想

福田新能源企业出海新航道：一站式服务平台引领全球化征程

中国航天科技集团一日三捷，火箭卫星发动机试验齐传佳音

GNOME Weather紧随Decibels，成GNOME第二款采用TypeScript核心应用

黑洞“Ansky”苏醒，释放百倍能量X射线，刷新科学认知

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.