【ITBEAR科技资讯】8月29日消息,SuperCLUE日前发布了最新的中文大模型8月榜单,为业界带来了一场关于语言模型实力的鲜明竞争。本次榜单包括了总排行榜、OPEN多轮开放问题排行榜、OPT三大能力客观题排行榜、十大基础能力排行榜以及开源排行榜等五个部分,旨在全面评估各大模型在不同领域的表现。
据ITBEAR科技资讯了解,SuperCLUE在本次评测中选择了16个最具代表性的通用大语言模型,并采用了全新的评测数据集,其中包含3337道测试题目。这一数据集设计旨在更准确地反映语言模型在实际应用中的表现。
在8月榜单中,Baichuan-13B凭借其经过STF迭代优化的第二版,在国内大模型评测中脱颖而出,夺得榜首位置。SuperCLUE对Baichuan-13B的效果给予了高度评价,认为其表现非常出色。
值得注意的是,虽然国外代表性模型,如GPT4.0、Claude2、gpt-3.5和Llama-2参与了榜单的对比,但并未参与排名。这意味着本次榜单聚焦于国内大模型的表现和竞争。
除了总排行榜的胜出,Baichuan-13B还在知识问答和生成创作领域展现出优异的表现,进一步巩固了其在多个领域的实力。此外,Baichuan-13B在开源排行榜中也大幅领先于Llama-2,显示了在开放共享方面的积极贡献。
综合来看,SuperCLUE的这份8月榜单为我们呈现了中文大模型领域的最新实力对比,Baichuan-13B的脱颖而出以及在多个领域的卓越表现将进一步推动语言模型技术的发展与创新。