随着AI技术的飞速发展,智能设备如AI手机、AI PC和AI眼镜正逐步向AI Agent化迈进。然而,这些小型终端要想充分利用大模型的能力,仍面临一个关键难题:如何构建一套端边云联动的解决方案,使小型设备也能承载大型模型的算力需求。
据行业观察,大模型技术正呈现出一种新趋势,即端边云协同,以加速端智能场景的实际应用。近年来,市场涌现出多种形态的端侧AI产品,如智能门锁、AI看护机和无人机等,它们主打轻量化部署,内置的AI模型小巧易用。然而,由于功耗和算力的限制,这些设备在处理复杂计算任务时显得力不从心,因此推理任务逐渐向边缘和云端转移。
在这一背景下,字节跳动旗下的云服务平台火山引擎在2024年冬季的FORCE原动力大会上,宣布了其边缘云的全面升级。此次升级优化了物联网平台、智能平台和边缘大模型网关服务,并推出了边缘原生智能体,旨在构建一套完整的基础设施,连接端侧小模型应用和边云大模型能力。
火山引擎边缘智能技术负责人表示,端侧通过OneSDK一站式解决方案,使嵌入式设备也能接入大模型;边缘侧则部署了大模型网关,提升了调用过程的效率和稳定性;中心侧通过编排智能体,降低了大模型部署的难度;而边缘原生智能体则可根据不同行业需求进行个性化定制。
在谈到边缘智能技术的最新优势和应用场景时,该负责人指出,边缘AI的发展可分为基础设施和应用场景两个方面。基础设施主要负责解决连接和计算问题,提供大模型的调度和计算推理能力。而应用场景的发展则受限于碎片化和难以规模化的问题。一套支持端边云联动的智能边缘架构能够在很大程度上解决这些问题,拓宽边缘AI的部署范围。
AI Agent与大模型的连接强化,以及计算任务的端边云协同处理,是当前技术发展的重点。火山引擎的边缘智能解决方案针对这些难题,展现出了两大技术优势。首先,该方案已被多家企业采用,无论是大型还是中小型企业,都能通过这一方案实现AI Agent的部署和应用。其次,该方案通过智能决策器,实现了算力的优化分配,既保证了计算任务的高效完成,又确保了数据的安全和隐私。
随着AI Agent生态的蓬勃发展,越来越多的公司开始引入这一技术。据数据显示,截至2025年1月4日,AI Agent的整体市值已达到173.6亿美元,过去一周的涨幅接近50%。有调研报告显示,超过半数的受访者已在生产过程中使用AI Agent,中型公司最为活跃,主要用于提高生产效率。
火山引擎的边缘智能基础架构,不仅优化了端智能的接入流程,提升了推理请求的加速性能和安全性,还增强了模型分发和智能体配置等功能。该架构已在国内多家企业和单位中得到应用,如润欣科技、地瓜机器人等,助力其业务增长。
为了更好适应AI Agent时代,火山引擎还推出了一系列端智能解决方案,包括OneSDK、OneCredential和OneStop。OneSDK提供了一站式解决方案,满足设备运维、设备安全和智能需求;OneCredential支持跨云服务权限的端智能解决方案,降低了资源占用和证书创建成本;OneStop则通过深度融合端云技术,降低了端侧智能体的开发与接入门槛。
火山引擎的智能决策器是另一个亮点。该决策器能够根据提示词等信息,将任务按需分发至本地、边缘或云端处理。它采用基于规则和模型的动态决策方式,综合考虑功耗、机型、温度和任务复杂性等因素,确保数据安全和隐私成为首要考虑原则。例如,在智能座舱中,车内摄像头的隐私对话和行为记录会被本地化处理,而复杂操作则交给云端大模型处理。
火山引擎的边缘大模型网关也发挥了重要作用。它具备标准接口、就近访问、推理加速和高鲁棒性四大核心能力,适配多家主流大模型厂商和智能体提供商,实现了快速接入和降低延迟。同时,通过全球范围的边缘节点和智能流量调度策略,进一步优化了访问效率。
边缘原生智能体作为AI模型端侧落地的重要形式,也受到了火山引擎的重视。它提出了四大必备能力,包括理解设备能力、连接物理世界、单智能体协同和多智能体协同。目前,边缘原生智能体已应用于智能数字工厂和智慧园区等领域,实现了工业质检和园区安防等功能。
火山引擎边缘云的分布式云网基础设施在全球拥有2500多个边缘节点,网络时延控制在1至40毫秒之间,支持端边互联、边边互联和边云互联场景,实现了智能应用的就近上云。同时,为了保障数据的安全传输,火山引擎还新增了针对AI Agent的边缘安全防护功能,包括提示词检测、系统提示词防御和结果检查等。