滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

OpenAI新推语音模型，助力AI语音交互更精准自然

时间：2025-03-21 15:26:59 来源：ITBEAR编辑：快讯团队 发表评论无障碍通道

OpenAI近期在语音技术领域取得了显著进展，于3月20日正式宣布推出全新的语音转文本及文本转语音模型，这一举措旨在增强语音处理能力，并为开发者提供更加精确和可定制化的语音交互系统解决方案，进一步推动人工智能语音技术的商业化落地。

在语音转文本方面，OpenAI推出了两款重量级模型：gpt-4o-transcribe和gpt-4o-mini-transcribe。据官方介绍，这两款模型在单词错误率、语言识别准确性和性能方面，均超越了现有的Whisper系列模型。它们能够支持超过100种语言的识别，通过强化学习和多样化的高质量音频数据集进行训练，有效捕捉语音中的细微特征，显著减少了误识别率。特别是在嘈杂环境、口音差异以及不同语速下，这两款模型表现出了更加稳定和出色的性能。

对于文本转语音领域，OpenAI推出了gpt-4o-mini-tts模型。这款模型允许开发者通过指令控制语音风格，如“模拟耐心客服”或“生动故事叙述”，从而满足多样化的应用场景需求。在客服领域，gpt-4o-mini-tts能够合成更具同理心的语音，提升用户体验；在创意内容方面，它则能够为有声书或游戏角色设计个性化声音，带来更加丰富和生动的听觉体验。

OpenAI在发布的博文中还详细公布了这三款模型的费用情况。gpt-4o-transcribe模型对于音频输入、文本输入和输出的费用分别为每100万tokens 6美元、2.5美元和10美元，每分钟成本为0.6美分。相比之下，gpt-4o-mini-transcribe模型则更加经济实惠，音频输入、文本输入和输出的费用分别为每100万tokens 3美元、1.25美元和5美元，每分钟成本为0.3美分。而gpt-4o-mini-tts模型的费用则为每100万tokens输入0.6美元，输出12美元，每分钟成本为1.5美分。

此次OpenAI推出的全新语音转文本和文本转语音模型，不仅提升了语音技术的性能和准确性，还为开发者提供了更加灵活和多样化的应用方案。随着人工智能技术的不断发展，这些模型有望在更多领域得到广泛应用，推动人工智能语音技术的进一步普及和商业化。

举报 0 收藏 0 打赏 0评论 0

更多>同类资讯

腾讯混元T1正式版发布，推理能力媲美DeepSeek-R1，价格更亲民

相比于T1-Preview，T1正式版基于腾讯混元3月初发布的业界首个超大规模Hybrid-Transformer-Mamba MoE大模型TurboS快思考基座，通过大规模后训练扩展了推理能力，并进一步对…

03-22

美团王兴：主动进攻AI，内部大模型longcat已上线

王兴在回答人工智能相关问题时表示，美团在人工智能技术方面的策略始终是“主动进攻”而非“被动防守”。美团的人工智能战略建立在三个层面上：首先是在日常工作中的应用；其次是在美团产品中的应用，还将推出全新的原生…

03-22

软银65亿美元大手笔！收购美国芯片设计巨头Ampere布局AI

03-22

乐鑫科技2024年度净利大增149%，非智能家居领域增速亮眼，端侧芯片布局加速！

03-22

腾讯混元T1深度思考模型发布：强推理、快回应，解锁超长文本处理新能力

03-21

百度地图领跑！核心API全面兼容MCP，大模型接入地图服务更便捷

03-21

Win11预览版大升级：画图、截图工具、记事本迎来AI新功能

03-21

Adobe新AI工具：Project Slide Wow，实时同步数据，让演示文稿更高效！

03-21

微软剑桥联手推出Aardvark Weather：AI让天气预报更精准高效

03-21

PCIe 7.0标准草案0.9版出炉，SSD普及还需苦等三年？

03-21

华为F5G-A万兆全光园区震撼登场：50G PON技术引领网络新升级！

03-21

云徙xAgent携手DeepSeek：重塑营销数字化底座，赋能企业智能化升级

03-21

富途“投资展”放大招：接入DeepSeek-R1，AI升级赋能零售投资者

03-21

富途接入DeepSeek，AI投资助手牛牛AI等升级功能亮相投资展

03-21

成龙电影A计划升级A³，可灵AI全程助力探索“人+AI”电影新纪元

03-21

点击查看更多 +

全站最新

本田新款踏板来袭！LA150与GU125，哪款是你的通勤首选？

星途星纪元ET纯电版上市，21.98万起配猎鹰智驾系统，续航最高760km

比亚迪超级e平台发布，5分钟闪充400公里，电动车新时代来临！

腾势N9震撼上市：续航破千三，爆胎稳行，智能安全再升级！

奥迪SQ9谍照抢先看！豪华大型SUV，2026年或将震撼上市

岚图知音联手游戏平台，智能座舱变身“移动电竞房”新潮流？

热门内容

本栏最新

腾讯混元T1正式版发布，推理能力媲美DeepSeek-R1，价格更亲民

乐鑫科技2024年度净利大增149%，非智能家居领域增速亮眼，端侧芯片布局加速！

腾讯混元T1深度思考模型发布：强推理、快回应，解锁超长文本处理新能力

百度地图领跑！核心API全面兼容MCP，大模型接入地图服务更便捷

Win11预览版大升级：画图、截图工具、记事本迎来AI新功能

Adobe新AI工具：Project Slide Wow，实时同步数据，让演示文稿更高效！

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.