在2025年初,字节跳动旗下的豆包大模型迎来了全面升级,1.5版本正式在火山方舟平台上线。此次升级中,豆包通用模型pro在多个权威测评中的表现尤为亮眼,其综合得分超越了GPT-4o、Claude 3.5 Sonnet等业界顶尖模型,标志着豆包大模型的效果已达到全球领先水平。
豆包通用模型pro不仅在性能上实现了飞跃,同时在推理成本上也做到了极致平衡。该模型采用了高效的MoE结构,使得性能杠杆提升至7倍,配合自研的高性能推理系统,实现了10毫秒级的低延迟。豆包大模型1.5版本还建立了高度自主的数据生产体系,确保数据的独立性和可靠性,未使用任何外部模型生成的数据。
除了通用模型pro的显著增强,豆包大模型1.5版本还对视觉理解模型进行了大幅优化,并推出了实时语音模型。尽管功能更加全面,但豆包大模型1.5版本的价格却保持不变,加量不加价,继续为用户提供高性价比的服务。
在实际测试中,豆包大模型1.5版本的综合能力得到了充分展现。在知识、代码、推理和中文权威测评基准上,Doubao-1.5-pro均取得了最佳成绩。例如,在代码能力测试中,针对一个创建简单Web API的问题,Doubao-1.5-pro不仅提供了可运行的完整代码,还详细说明了如何在本地运行和测试,其输出格式和代码说明均优于GPT-4o。
在知识能力测试中,Doubao-1.5-pro同样表现出色。针对唐代包含“过年”主题的古诗问题,Doubao-1.5-pro不仅给出了更多数量的答案,还对每个答案进行了详细的解析,包括原文和背景介绍,使得用户能够更深入地了解问题。相比之下,国内某大模型产品的答案则显得较为简略。
在推理能力测试中,Doubao-1.5-pro同样展现出了强大的实力。针对一个关于理财选择的复杂问题,Doubao-1.5-pro不仅给出了针对性的建议,还条理清晰地分析了不同理财产品的收益情况,满足了用户的基本需求。而另一款模型则因数据库问题,给出的回答相对空泛。
豆包大模型1.5版本还推出了更加轻量化的Doubao-1.5-lite模型。该模型具备极致的响应速度,适用于对时延有更高要求的场景。在实际测试中,Doubao-1.5-lite在处理中等难度的推理问题和专业知识题目时,均表现出了出色的性能和响应速度。
在视觉理解方面,豆包大模型1.5版本的Doubao-1.5-vision-pro同样令人惊艳。该模型在多模态数据合成、动态分辨率、多模态对齐和混合训练等方面进行了全面升级,进一步增强了视觉推理、文字文档识别、细粒度信息理解和指令遵循等方面的能力。在实际测试中,Doubao-1.5-vision-pro对复杂图表、低清晰度图片和字迹潦草的手写图片等均表现出了精准的识别和理解能力。
此次豆包大模型1.5版本的升级和火山引擎在B端市场的进一步拓展,共同推动了AI技术的普惠化。字节跳动通过不断优化推理成本、提升模型性能和技术优势,为用户提供了更加高性价比的服务,也为AI技术的商业化落地探索出了新的道路。