【ITBEAR】近期,中文大模型领域的竞争格局再度迎来新变动。据最新发布的《中文大模型基准测评2024年10月报告》显示,智谱科技自主研发的GLM-4-Plus模型在SuperCLUE测评中脱颖而出,成为国内外43个大模型中的佼佼者。
SuperCLUE测评旨在全面评估大模型的综合性能,通过对国内外具有代表性的模型进行多维度、多层次的测试,实时跟踪其发展趋势。在本次测评中,GLM-4-Plus凭借在基础能力和应用能力上的出色表现,不仅在国内大模型中位列第一,而且与国际顶尖模型ChatGPT-4的差距也缩小至2分以内。这一成绩充分展示了智谱科技在大模型领域的深厚积累和持续创新能力。
值得注意的是,GLM-4-Plus的优异表现并非偶然。作为智谱全自研GLM大模型的最新版本,该模型在语言理解、逻辑推理、指令遵循以及长文本输出等方面均实现了显著突破。这些能力的提升,使得GLM-4-Plus在代码计算、数据分析、图像/视频特征识别等多个领域都展现出了强大的性能,同时大幅降低了成本。
GLM-4-Plus在司南OpenCompass公布的大语言模型对战榜单Compass Arena中也表现出色。据榜单显示,GLM-4-Plus的竞技场评级分数位居榜首,超越了包括GPT-4在内的众多国际知名模型。这一成绩进一步证明了GLM-4-Plus在真实用户场景中的卓越表现,也体现了智谱科技在大模型技术领域的领先地位。
据悉,Compass Arena榜单致力于构建一个公正、开放、透明的竞争环境,通过用户真实反馈和大模型间的对战数据,采用Elo评分系统对大模型进行排名。GLM-4-Plus能够在如此激烈的竞争中脱颖而出,无疑是对其技术实力和用户体验的双重肯定。
目前,GLM-4-Plus已经正式上线智谱开放平台bigmodel.cn,供广大开发者和用户试用。随着技术的不断进步和应用的持续拓展,相信GLM-4-Plus将在未来为更多领域带来创新和变革。