【ITBEAR】在RTE2024第十届实时互联网大会的舞台上,声网的首席科学家兼CTO钟声带来了一场引人深思的演讲。他深入探讨了AI基础设施的进化趋势,以及AI应用在未来社会的广泛前景。
钟声指出,随着技术的进步,AI分身和AI助手将成为可能,它们能够极大地缓解人们时间上的稀缺性,并提升生活的整体体验。他特别强调了分布式端边云结合的AI系统,这种系统将计算和传输在各节点进行合理配置,智能地根据任务需求进行编排,从而降低成本,提高效率。
在探讨信息传播与消费的历史演变时,钟声提到了印刷技术如何改变人类历史的走向,以及互联网如何进一步提升了信息传播的效率和范围。他认为,现在我们正处于一个新时代,生成式AI的快速发展正打破内容生成的瓶颈,为用户带来更加个性化和沉浸式的体验。
钟声也坦诚地谈到了当前AI大模型面临的挑战,包括高昂的成本、隐私保护的问题以及用户体验的局限性。他提出,分布式端边云结合的AI系统正是解决这些问题的关键。这种系统不仅能有效降低成本,还能在技术机制层面为隐私数据提供更好的保护,并优化用户体验。
在演讲中,钟声还现场演示了一个由STT、LLM、TTS、RTC四个模块组成的端边结合实时对话AI智能体。这个智能体在复杂的噪声环境下表现出了出色的对话能力,展示了实时AI对话技术的巨大潜力。
钟声还探讨了未来AI基础设施的要素,包括允许多云策略、深度异构计算模型的优化,以及生成式视频模型的新思路。他强调,这些技术的发展将极大地拓展AI的应用范围,并提升用户体验。
最后,钟声以meta最新推出的AR眼镜Orin为例,展望了未来端设备的多样化和能力提升将如何推动AI技术的普及和应用。他相信,随着AI技术的不断发展和优化,我们将能够利用AI分身和AI助手更有效地服务和帮助人们,从而创造更加美好的未来。