滚动资讯

当前位置：首页 > 资讯 > 数字家电 > 正文内容

声网刘斌：RTE如何成为生成式AI时代的基础设施关键？

时间：2024-12-20 15:31:49 来源：ITBEAR编辑：快讯团队 发表评论无障碍通道

在近日由量子位主办的MEET2025智能未来大会上，声网的COO刘斌发表了精彩的主题演讲，深入探讨了实时多模态趋势下，RTE（实时互动引擎）如何推动AI Agent应用的落地，并展望了其在生成式AI时代中的基础设施角色。

刘斌首先提及了两个重要事件：今年10月，声网的关联公司Agora作为语音API合作伙伴，出现在OpenAI发布的Realtime API公开测试版中；而在同月的RTE2024实时互联网大会上，声网宣布正与MiniMax共同研发国内首个Realtime API。这两个事件标志着大模型交互正快速向实时多模态发展。

刘斌指出，多模态模型的推出，改变了传统的纯文本交互方式，实现了从异步到实时双工交互的飞跃。然而，在实际应用中，用户设备往往无法保持在固定的网络与物理环境下，这对大模型实时语音对话中的低延时传输、网络优化等提出了挑战。模型交互中的智能打断和主动交互能力也是用户关心的重点，这要求不仅有强大的模型能力，还需要端到端的技术支持。

作为全球实时互动云行业的开创者，声网凭借在音视频领域的深厚积累，将RTE与生成式AI相结合，推出了声网Conversational AI Agents，旨在帮助开发者和企业快速构建适配自身业务场景的AI实时语音对话服务。通过自研的SD-RTN™实时传输网络，声网实现了全球范围内的低延时音视频传输，语音对话延迟低至500ms，并通过一系列技术手段保证了对话的实时性和流畅性。

在支持智能打断方面，声网自研的AI VAD技术能够适应人类对话的停顿、语气和节奏，支持对话过程中的随时打断。同时，声网的解决方案还优化了AI角色，保留了情绪情感等关键信息，提供了超拟人的真实音色，丰富了通话体验。

声网的音视频SDK经过不断迭代升级，能够支持30多个平台框架、30000多种终端机型及各种操作系统，包括各类IoT设备终端。在音频处理方面，声网具备业界领先的音频3A能力，提供AI回声消除、AI智能降噪等自研音频技术，确保在嘈杂环境中AI对话不受影响。

在与大模型厂商的合作中，声网发现现有RTE技术栈和基础设施仍有改进空间。刘斌表示，只有不断演进，大模型才能在各种场景和形态下大规模参与人的语音对话，并基于云、设备端、边缘等多维度进行参与和协作。基于这些能力的改进和普及，未来RTE将成为生成式AI时代AI基础设施的关键部分。

刘斌还介绍了声网的AI RTE产品矩阵，包括Linux Server SDK、AI VAD能力、AI Agent Service等，都在进行补充与优化。他展示了声网的RTE+AI能力全景图，包括RTE+AI生态能力、声网AI Agent、Conversational AI Agents解决方案等，全面展现了声网对RTE+AI的整体思考和布局。

举报 0 收藏 0 打赏 0评论 0

更多>同类资讯

2025年1000元卧室投影仪的全面评测：当贝Smart1音画双绝

随着2025年到来，众多消费者将目光投向了卧室投影仪。这类产品凭借便捷与娱乐功能，深受年轻群体青睐。尤其是平价的千元投影仪，凭借超高性价比，已然成为市场热门之选。那么，2025年千元卧室投影仪究竟该如何挑选?在此推荐当贝Smart1，它以出色性能与亲民价格，赢得众

12-20

JBL Nearbuds2代：运动爱好者的音乐新宠，清晰音质伴你行

12-20

BadBox安卓僵尸网络肆虐：19万台智能电视手机中招！

12-20

JBL Nearbuds2代：运动音乐新伴侣，33克轻盈畅享无线自由

12-20

电子游戏真能提高智力？万人研究揭示游戏时间与智力提升正相关

12-20

英特尔Wildcat Lake处理器治具曝光，或采用新型BGA1516插槽

12-20

博纳影业海南新设公司，注册资本达亿元，业务覆盖影视制作全链条

12-20

CES 2025前瞻：AI引领潮流，国产技术能否再创辉煌？

12-20

ROG龙神3代EXTREME水冷白版首发，颜值性能双在线，你心动了吗？

12-20

岁末家政需求激增，京东家政如何应对？加大招聘力度保障服务

12-20

TCL携多款新品亮相CES 2025，成参展面积最大中国品牌！

12-20

联想YOGA新笔记本曝光：居中打孔屏设计，搭载酷睿Ultra 200V系列处理器？

12-20

特斯拉全系搭载AMD芯片，车机响应速度领先，你试过了吗？

12-20

国产AI眼镜新突破：闪极拍拍镜999元起，高清续航挑战科技巨头

目前，闪极AI拍拍镜的眼镜硬件、手机端闪极App1.0、Hi闪极AI助手1.0、AI云盘1.0、AI闪记1.0已完成开发，而时光回溯、实时翻译、直播推流、智能记忆、语音转写等AI功能还在开发中。据张波分享，…

12-20

博纳影业海南新设制作公司，百川博纳注册资本达亿元

三言科技 12月20日消息，天眼查App显示，近日，海南百川博纳影视制作有限公司成立，法定代表人为杨森，注册资本1亿人民币，经营范围含电视剧制作、电影发行、电影放映、广播电视节目制作经营、信息网络传播视听节目…

12-20

点击查看更多 +

全站最新

极越徐继业被开除风波再起，真相究竟如何？

微软Edge安卓版大升级：全新密码管理器与PDF阅读器来袭

比亚迪腾势D9 OTA大升级，新增哨兵模式等多项智能功能！

英特尔Wildcat Lake处理器治具曝光，或采用新型BGA1516插槽

极越徐继业称开除邮件为“假诏”，朋友圈暗示将曝新瓜？