火山引擎近期在AI技术领域取得了显著进展,为企业用户带来了更为高效和经济的Agent应用开发方案。此次发布涵盖了模型升级、Agent工具创新以及云基础设施的优化。
首先,火山引擎推出了豆包1.5·深度思考模型,该模型基于MoE架构,总参数高达200B,但激活参数仅20B,实现了高效能的同时降低了运行成本。值得注意的是,豆包1.5不仅具备强大的文本处理能力,还融入了视觉理解能力,能够结合文字与图像进行立体思考,为模型增添了“眼睛”与“大脑”的双重功能。
豆包家族的另外两个重要成员也迎来了升级。豆包·文生图模型3.0在文字排版、图像生成效果以及高清图片生成方面实现了显著提升,能够生成实拍级别的2K高清图片。而豆包·视觉理解模型则进一步增强了模型的图像解析能力,为企业提供了更为精准的视觉识别服务。
在Agent服务方面,火山引擎推出了OS Agent解决方案,该方案通过veFaaS平台对豆包大模型进行封装,使得企业和开发者能够轻松构建轻量级的Code use和Browser use应用。对于任务更为复杂的Computer Use和Mobile Use Agent,火山引擎则提供了ECS或云手机等调用方式,结合豆包1.5·UI-TARS模型,实现了图形用户界面的精准交互,能够准确识别用户任务需求并进行自主推理和行动。
火山引擎还发布了AI云原生·ServingKit推理套件,该套件面向大规模推理场景,为企业提供了高效、稳定的推理服务,进一步提升了AI应用的性能和稳定性。
据火山引擎公布的数据,截至2025年3月底,豆包大模型的日均tokens调用量已超过12.7万亿,这一数字是2024年12月的3倍,更是其发布之初的106倍,彰显了豆包大模型在市场中的广泛应用和认可度。