滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

360联合北大震撼发布！5%参数量逼近Deepseek-R1满血性能

时间：2025-02-25 14:22:18 来源：互联网编辑：茹茹 发表评论无障碍通道

2025年2月24日——由360与北京大学联合研发的中等量级推理模型Tiny-R1-32B-Preview正式亮相，仅以5%参数，逼近Deepseek-R1-671B的性能。

核心突破：小模型，大能量

▪ 数学领域：以78.1分(AIME 2024评测)逼近原版R1模型(79.8分)，远超Deepseek-R1-Distill-Llama-70B(70.0分);

▪ 综合性能：在编程(LiveCodeBench 61.6分)、科学(GPQA-Diamond 65.0分)领域全面领先最佳开源70B模型Deepseek-R1-Distill-Llama-70B;

▪ 效率跃迁：仅需5%参数量，性能达原版R1的95%以上，推理成本大幅降低。

技术革新：领域专精+模型融合

研究团队使用「分治-融合」策略：

▪ 基于DeepSeek-R1生成海量领域数据，分别训练数学、编程、科学三大垂直模型;

▪ 通过Arcee团队Mergekit工具智能融合，突破单一模型性能上限，实现多任务均衡优化。

开源承诺：推动技术普惠

▪ 模型仓库：https://huggingface.co/qihoo360/TinyR1-32B-Preview

▪ 即将公开完整技术报告、训练代码及部分数据集；

▪ 践行开源精神，助力AI社区共筑高效推理新生态。

研发团队表示：「Tiny-R1-32B-Preview是蒸馏技术的里程碑，未来将持续探索更轻量、更强大的通用模型，推动AI技术普惠化进程。」

360 团队: Lin Sun, Guangxiang Zhao, Xiaoqi Jian, Weihong Lin, Yongfu Zhu, Change Jia, Linglin Zhang, Jinzhu Wu, Sai-er Hu, Xiangzheng Zhang

北大团队: Yuhan Wu, Zihan Jiang, Wenrui Liu, Junting Zhou, Bin Cui, Tong Yang

举报 0 收藏 0 打赏 0评论 0

更多>同类资讯

Deepseek算卦DIC 2025，今年“巳”个好年

2022年11月，OpenAI研发的ChatGPT问世，它能理解人类语言并与人类互动，还可协助完成写论文、创作诗歌等文字工作。这一创新应用突破了传统AI的交流局限，掀起大模型发展浪潮。各大科技公司意识到掌握先进大模型技术的重要性，纷纷投入其中，迅速打响“百模大战”。在这

02-25

深圳发力！角逐AI、低空经济新赛道，打造全球首个空天地一体化网络

2月25日，深圳市市长覃伟中作工作报告。报告显示，深圳将全力竞逐人工智能、低空与空天等产业新赛道，深入实施“人工智能+”行动，加快算法理论、智算芯片、具身智能、高阶智驾、端侧轻量化模型等核心突破，打造超智协同…

02-25

波士顿动力创始人点赞中国宇树机器人，展望AI创新未来

02-25

DeepSeek热潮下英伟达H20芯片中国订单激增，黄仁勋松了一口气？

02-25

Salesforce携阿里云深耕中国市场，棋局如何布？

02-25

智元机器人发布AgiBot Digital World，打造机器人仿真新生态

02-25

阿里达摩院生态大会聚焦RISC-V，首席科学家将谈DeepSeek创新机遇

三言科技消息阿里达摩院旗下品牌玄铁宣布，2月28日将举办“2025玄铁 RISC-V 生态大会”。与来自全球的行业专家、技术领袖、企业决策者和RISC-V 资深工程师共赴北京，一同探讨技术趋势。从会议议…

02-25

大厂AI风起时，为何创新步履维艰？

他三十不到，前年从一个自媒体去了大厂，费了很大劲，现在急缺成功案例来证明自己，这其实也怪我，他刚去大厂的时候，我就PUA他，跟他说，在圈子里混，要有自己的“名片”，在媒体的时候，能幸运的写一篇脍炙人口的作品…

02-25

DeepSeek再开源利器！EP通信库DeepEP引领MoE模型训练新潮流

据悉，DeepSeek本次“开源周”将陆续开源5个代码库。今天，DeepSeek官方推出开源第二弹：首个用于MoE模型训练和推理的EP通信库DeepEP。 1. 高效优化的 All-to-All 通信 3…

02-25

声网母公司Agora Q4财报亮点：营收稳健增长，GAAP口径下首现季度盈利

02-25

神雲科技全新服务器问世，搭载英特尔至强6 P核处理器引领AI与HPC新纪元

02-25

阿里QwQ-Max推理模型开源，本土AI生态迎来新飞跃？

02-25

天翼云AOne携手DeepSeek，如何助力企业智能升级与数据安全并行？

02-25

成都中小学“机器人授课”传闻系谣言，市教育局：正探索人工智能教学

02-25

Anthropic融资再升级，或获35亿美元助力AI技术新飞跃

02-25

点击查看更多 +

全站最新

沃飞长空引领低空经济新风尚，AE200助力“成都智造”翱翔全球

阿维塔“塔界”商标引热议，华为“第六界”猜想再起波澜？

微软Xbox去独占化，全球主机市场格局或将重塑？

嘉兆电子B+轮融资超亿元，芯片测试行业迎来新突破

豹5智驾版：双轨并行，开启新能源越野智驾新纪元

智驾平权浪潮下，车主的真实需求与安全考量何在？

热门内容

本栏最新

波士顿动力创始人点赞中国宇树机器人，展望AI创新未来

DeepSeek热潮下英伟达H20芯片中国订单激增，黄仁勋松了一口气？

阿里达摩院生态大会聚焦RISC-V，首席科学家将谈DeepSeek创新机遇

DeepSeek再开源利器！EP通信库DeepEP引领MoE模型训练新潮流

声网母公司Agora Q4财报亮点：营收稳健增长，GAAP口径下首现季度盈利

神雲科技全新服务器问世，搭载英特尔至强6 P核处理器引领AI与HPC新纪元

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.