滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

国产大模型阶跃星辰：在全球最难LLM基准测试中夺冠！

时间：2024-11-21 14:35:39 来源：智东西作者：智东西编辑：瑞雪 发表评论无障碍通道

【ITBEAR】在近期公布的LLM基准测试项目LiveBench的官方榜单上，中国大模型“六小虎”成员之一——阶跃星辰的大语言模型step-2-16k-202411，以卓越表现夺得全球第五、国产第一的佳绩。这一成就不仅标志着中国AI技术的飞速进步，也彰显了阶跃星辰在AI领域的深厚底蕴。

▲LiveBench榜单总评分前15名

LiveBench项目，由Abacus.AI主导，并吸引了图灵奖得主、meta首席AI科学家杨立昆的参与，因其严格的评测标准和每月更新的题库，被誉为“最难糊弄的LLMs基准测试”。这一项目不仅要求大模型具备全面的能力，还强调测试的公正性和真实性，有效避免了测试集污染等问题。

阶跃星辰的step-2-16k-202411，在LiveBench的六类别任务中，尤其在指令跟随（IF Average）方面，以86.57的高分力压群雄，甚至超过了OpenAI的o1-preview-2024-09-12。这一成绩不仅体现了step-2-16k-202411在语言生成上的精准控制力，更展示了其强大的理解和遵循人类指令的能力。

▲LiveBench官网博客

阶跃星辰的step-2-16k-202411，是该公司自研的万亿参数MoE大语言模型。在设计过程中，阶跃星辰放弃了upcycle（向上复用）路径，选择了从头开始训练的艰难道路。通过部分专家共享参数、异构化专家设计等创新手段，阶跃星辰成功构建了Step-2 MoE架构，不仅提升了模型的性能，还确保了每个“专家模型”都能得到充分训练。

今年3月，Step-2预览版发布，成为国内首个由创业公司发布的万亿参数MoE大语言模型。随后，在7月的世界人工智能大会上，Step-2正式发布，其出色的数理逻辑、编程、世界知识、指令跟随等能力，全面逼近GPT-4，引发了业界的广泛关注。

阶跃星辰的Step系列模型，除了万亿MoE大语言模型Step-2外，还包括多模态理解大模型Step-1.5V、图像生成模型Step-1X等，形成了全面的模型矩阵。同时，阶跃星辰还推出了C端应用“跃问”和“冒泡鸭”，将AI技术应用于实际生活中，为用户提供了更加便捷、智能的服务。

阶跃星辰的成立时间虽短，但其在AI领域的深耕细作，使其在短时间内取得了显著的成果。此次在LiveBench榜单上的优异表现，不仅是对阶跃星辰技术实力的肯定，更是对中国AI产业发展的鼓舞。在全球AI赛场上，国产大模型正逐渐崭露头角，展现出强大的竞争力和发展潜力。

举报 0 收藏 0 打赏 0评论 0

更多>同类资讯

AI赋能外贸，首批尝鲜者已领跑赛道

11-22

AI对战“麦学”：当AI遇上麦琳，沟通难题能否迎刃而解？

我知道你说没送到‘心趴’上，是希望我能更懂你，我会的，以后我会多留意你喜欢的口味这些小细节，这次你就原谅我这一回吧，我会让下一次的礼物完美地落在你的‘心趴’上的。” 文心一言：亲爱的，我知道我说的话可能让你觉…

11-22

搜狗输入法新功能上线，AI大模型助力实现“输入即搜索”

11-22

苹果iOS 19或将推出全新对话式Siri，AI大模型驱动体验升级

11-22

大模型遇瓶颈，厂商探索推理层新路径，Scaling Law将如何演进？

下一代要发布的旗舰模型Orion，在预训练阶段只用了20%的训练量，就达到了GPT4的水平，能力上升的很快，但OpenAI的研究者发现，后边增加训练量，Orion的水平提升却很慢很微小，没有实现从GPT3到…

11-22

英伟达利润暴增，AI芯片需求热潮能否持续引领科技新篇章？

11-22

苹果2026年将推全新Siri，对话能力飞跃挑战ChatGPT？

三言科技11月22日消息，据知情人士爆料，苹果公司正全力打造一款对话能力实现质的飞跃的Siri数字助理，旨在与OpenAI的ChatGPT以及其他领先语音服务一较高下。这款仍处于高度保密研发阶段、细节尚未公开…

11-22

跨境电商新风口！超30亿资金涌入，哪些概念股成香饽饽？

11-22

A股收跌超3%！盘面热点散乱，哪些板块逆势上扬？

11-22

新壹科技获互联网大会大奖，AI大模型如何助力金融行业智慧升级？

11-22

每日互动营销数盘升级，助力品牌破解存量时代营销难题

11-22

数字化微创介入新时代：海信医疗引领超声手术室智能化升级

11-22

AI搜索能否破局？传统搜索引擎的未来之路仍显漫长

生成式AI的诞生，给了传统搜索引擎更沉重一击，人们不再需要在搜索结果中，寻找所需信息，AI已可以通过自然对话方式，代替思考，提供答案。 2023年8月，昆仑万维推出了国内第一款AI搜索引擎，2个月后，百度也…

11-22

久其软件天津新设公司，经营范围涵盖AI软件开发与销售

11-22

浪潮云图安世纪展应急创新，海若大模型助力安全管理提效

11-22

点击查看更多 +

全站最新

火星红颜之谜：氧化铁遍布的背后，究竟隐藏着怎样的秘密？

小行星带：横跨2.25亿公里，质量竟不及月球4%？奥秘何在？

银河系内或有三亿“隐藏地球”？探索宇宙奥秘，寻找第二家园

宇宙穿梭梦：光速极限能否被打破？未来科技将如何改写星际旅行？

中国载人航天新进展：空间站稳定运行超千天，月球探测初样研制中

仁神星掩星：御夫座恒星将上演短暂“隐身”奇观

热门内容

本栏最新

AI赋能外贸，首批尝鲜者已领跑赛道

AI对战“麦学”：当AI遇上麦琳，沟通难题能否迎刃而解？

搜狗输入法新功能上线，AI大模型助力实现“输入即搜索”

苹果iOS 19或将推出全新对话式Siri，AI大模型驱动体验升级

大模型遇瓶颈，厂商探索推理层新路径，Scaling Law将如何演进？

英伟达利润暴增，AI芯片需求热潮能否持续引领科技新篇章？

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区 · 齐鲁软件园鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.