近期,智源研究院揭晓了一项涉及国内外100多个开源与商业闭源大模型的全面评测结果,引起了业界的广泛关注。在备受瞩目的大语言模型评测能力榜单中,一款名为豆包通用模型pro(Doubao-pro-32k-preview)的国产大模型,在主观评测环节脱颖而出,荣获榜首。
据悉,智源研究院的Flageval评测平台,已纳入全球超过800个开闭源大模型,并与国内十余所高校及机构合作,共同构建评测方法与工具。此次评测中,大语言模型的主观评测尤为注重模型的中文处理能力。豆包通用模型pro凭借其卓越表现,赢得了专家评审团的高度认可。
不仅如此,在多模态模型评测榜单的视觉语言模型分类中,豆包·视觉理解模型(Doubao-Pro-Vision-32k-241028)同样表现出色,仅次于GPT-4,成为得分最高的国产大模型。这一成绩不仅彰显了豆包大模型在视觉语言理解领域的深厚实力,也为其在更多应用场景中的拓展奠定了坚实基础。
在Flageval大模型角斗场榜单中,豆包通用模型pro同样不负众望,位居大语言模型榜单的第二名,仅次于OpenAI的o1-mini。这一成绩再次证明了豆包大模型在业界的领先地位,以及其在处理复杂语言任务方面的卓越能力。
随着使用量的不断攀升,豆包大模型也迎来了全新的升级。数据显示,自今年5月发布以来,豆包大模型的日均tokens使用量已超过4万亿,增长了33倍之多。这一增长不仅推动了豆包大模型在不同应用场景中的广泛应用,也为其性能的持续优化提供了有力支撑。
此次升级后,豆包通用模型pro在综合处理能力上提升了32%,推理能力提升了13%,指令遵循能力提升了9%,代码处理能力提升了58%,数学能力提升了43%,专业知识领域能力也提升了54%。这一系列显著的提升,使得豆包大模型在处理复杂任务时更加游刃有余。
与此同时,豆包·视觉理解模型也在FORCE原动力大会上正式对外发布。该模型能够理解用户输入的文本和图片信息,并给出准确的回答。凭借其强大的内容识别、理解和推理能力,以及细腻的视觉描述能力,豆包·视觉理解模型在教育、旅游、电商等场景中具有广泛的应用前景。
为了更好地帮助企业开拓大模型的创新应用场景,豆包·视觉理解模型还提供了极具竞争力的价格。每千tokens仅需0.003元,比行业平均价格降低了85%。这一举措无疑将大大降低企业使用大模型的门槛,推动AI大模型应用的普及与落地。