ITBear旗下自媒体矩阵:

RTE大会十年:声网如何从实时音视频拓荒者走向AI融合前沿?

   时间:2025-01-08 19:45:54 来源:ITBEAR编辑:快讯团队 发表评论无障碍通道

2015年,声网公司勇敢地迈出了第一步,将WebRTC大会引入中国,成功举办了首届面向国内开发者、业务人员及用户的RTC(实时视音频)大会。在那场大会前夕,时任声网市场VP及RTC大会主策人的彭小欢,心中满是对大会能否吸引足够参与者的忐忑。然而,十年后的今天,这一担忧早已烟消云散。RTE(实时互联网)大会已步入第十个年头,10月25日,RTE 2024大会如期举行,现场座无虚席,热闹非凡。

在RTE2024大会的现场,国内大模型领域的佼佼者纷纷亮相,智谱、MiniMax、零一万物团队均现身其中。自ChatGPT发布以来,智谱和MiniMax分别在B端和C端市场深耕细作,积累了丰富的经验。通义千问团队也带着国内最大的开发者生态,加入了此次RTE大会的讨论。AI领域的知名创业者如贾扬清,这位全球瞩目的AI科学家,也在RTE大会的主论坛上分享了他在AI Infra领域创业18个月后的心得,以及对RTE+AI趋势的独到见解。

谷歌、蚂蚁、面壁智能、生数科技、商汤、旷视、WPS、Soul等企业也在大会上分享了他们在ChatGPT时代下的AI探索成果。今年的RTE大会,大咖云集,AI内容占据了主导地位。

从RTC大会到RTE大会,十年间,声网始终坚守初心,从未间断地举办这一盛会。如今,RTE大会已成为全球规模最大的音视频行业峰会之一,规模从最初的一个主会场、一个分论坛和一个workshop,发展到如今的20多个论坛,观众人数上限一度达到六七千人。据声网官方统计,这十年间,大会累计影响了200多万开发者,覆盖了300多个行业场景,吸引了2000多名专家讲师参与分享。

声网创始人赵斌在大会上表示,生成式AI正在推动IT行业发生深刻变革,主要体现在终端、软件、云和人机界面四个层面,其中AI Native Cloud将成为主流。Lepton AI创始人兼CEO贾扬清也认为,AI是云的第三次浪潮,实时的交流和智能的结合在用户体验环节至关重要。

在大会的圆桌讨论环节,五位嘉宾围绕AI的6000亿美金难题,探讨了从AI基础设施到AI商业化落地的机会与挑战。贾扬清认为基于开源架构的应用会越来越普遍,而王铁震则强调了开源模型的基础设施和数据闭环的重要性。MiniMax合伙人魏伟分享了模型在艺术和影视等领域的创新应用,面壁智能联合创始人及CTO曾国洋则预测未来算力成本将不断优化。

声网在此次大会上发布了RTE+AI能力全景图,从实时AI基础设施、RTE+AI生态能力、声网AI Agent、实时多模态对话式AI解决方案、RTE+AI应用场景五个维度,全面展示了RTE与AI相结合的技术能力与应用方案。赵斌指出,生成式AI与RTE结合带来的场景创新,将成为下一个十年的主题。

今年5月,GPT-4o的发布再次引发了业内的热议,其展示的实时语音交互能力令人印象深刻。GPT-4o通过采用RTC方案,实现了自然、流畅的低延时语音交互体验。这一成果再次证明了RTC技术在连接多模态大模型与实时互动场景中的关键作用。

声网CEO赵斌表示,生成式AI的一个重要发展方向是向多模态深度进化。目前,文字训练数据已得到充分利用,而声音和视觉数据的获取和运用将为大模型提供几乎无限的数据空间。因此,多模态成为当下的重要发展方向。在推进多模态深度进化上,声网通过与多个行业伙伴的深度合作,发现多模态对话体验的关键在于声音体验和人与大模型支持的agent对话时的互动体验。

赵斌认为,只有把RTE技术运用得足够好,部署到全球各个云和边缘节点,大模型的多模态能力才能普遍地、高质量地走进各种实时互动场景。在这场多模态带来的实时对话式AI的竞争中,拥有核心技术和具备行业解决方案能力的实时音视频厂商将占据优势。

OpenAI在10月初发布了实时API公测版,并公布了三家语音API合作者的身份,其中就包括声网的兄弟公司Agora。从底层的RTC等音视频能力来看,Agora和声网都拥有深厚的技术积累。相较于市面上大部分2-3秒的AI互动延迟实践,声网的对话式AI解决方案将对话响应延时优化至500毫秒,实现了真实、自然的AI语音交互体验。

声网在AI领域的探索并非一时兴起,早在四年前,当transformer在学术界崭露头角时,声网就率先将AI技术引入RTE技术栈,用于改善音视频传输保障。如今,声网正与MiniMax合作,打磨国内首个Realtime API,为人工智能体提供流畅、自然的实时语音对话能力。这一创新成果再次证明了声网在实时音视频领域的领先地位和深厚的技术实力。

举报 0 收藏 0 打赏 0评论 0
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  RSS订阅  |  开放转载  |  滚动资讯  |  争议稿件处理  |  English Version