声网Agora,Inc.(纳斯达克:API)近日揭晓了2024年第四季度及全年财务报告,展现了公司在复杂市场环境下的稳健表现和创新活力。
在2024年第四季度,声网实现了总营收3445万美元,同比增长3.6%(剔除已终止的低毛利业务后)。尤为公司预计在2025年第一季度,这一增速将进一步提升至4.4%至11.1%,显示出加速增长的态势。
财务数据显示,声网在第四季度实现了净利润16万美元,成功实现了同比扭亏为盈,这标志着公司在成本控制和盈利能力上的显著提升。声网的创始人兼首席执行官赵斌对此表示,新应用场景带来的收入增长以及有效的成本管控是公司实现盈利的关键因素。他进一步强调,声网将在2025年继续聚焦于提升运营效率,推动业务的可持续增长。
在技术创新方面,声网本季度推出了对话式AI引擎的Beta版,为开发者提供了前所未有的便捷。开发者仅需两行代码,就能在15分钟内部署基于任何大模型的对话式AI Agent。赵斌指出,许多大语言模型尚未开放语音交互功能,而声网的对话式AI引擎正是为解决这一痛点而生。该引擎不仅提供了自然流畅的对话体验,还拥有先进的语音处理能力和超低延迟,将加速对话式人工智能在各行业的应用渗透。
在客户规模上,声网同样取得了显著进展。截至2024年12月31日,公司的活跃客户数量达到1979个,同比增长8%;全球注册应用数超过93.1万个,同比增长25%。这些数据充分证明了声网在全球市场的影响力和竞争力。
声网的对话式AI引擎不仅提供了极致的对话体验,还实现了极简的开发部署。开发者可以在Console后台自行开通服务接入API,并在Playground中实际调参、测试并生成代码。该引擎的核心优势包括超低响应延迟、优雅打断、对话人声锁定以及全模型适配等。在响应延迟方面,AI可以秒回人类提问,语音对话延迟低至650毫秒;声网自研的AIVAD技术则支持AI对话过程中随时优雅打断,响应低至340毫秒。
声网的对话式AI引擎还结合了多年积累的AI降噪等音频对话处理能力,能智能屏蔽95%交互中的各类背景人声与噪声干扰。即使在嘈杂环境中,也能保证对话应答精准、流畅。通过对比测试,在噪杂的环境下,声网方案的误打断率较ChatGPT降低50%。同时,该引擎还支持DeepSeek、ChatGPT等全模型适配,音视频SDK支持30000+终端机型适配,解决了多设备兼容性的后顾之忧。
声网的对话式AI能力已在多个场景中得到了广泛应用,包括智能助手、虚拟陪伴、口语陪练、智能客服以及智能硬件等。特别是在智能硬件行业,声网持续优化AIxIoT智能硬件解决方案,已实现在低功耗、低算力芯片上快速接入大模型,保证了低延时实时互动、低成本灵活适配的特性。在CES2025展会上,博通集成携手声网推出了多款智能产品原型机,进一步展示了声网领先的实时多模态对话式AI技术的应用潜力。