滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

硅基流动携手华为云，CloudMatrix超节点助力DeepSeek-R1性能飙升

时间：2025-04-11 11:37:54 来源：ITBEAR编辑：快讯团队 发表评论无障碍通道

在近日举行的华为云生态大会上，硅基流动公司的创始人袁进辉带来了一项重大宣布：硅基流动携手华为云，基于CloudMatrix 384超节点昇腾云服务以及高性能推理框架SiliconLLM，正式推出了DeepSeek-R1的最新版本。这一版本采用了大规模专家并行的最佳实践，为用户带来了前所未有的性能体验。

据悉，DeepSeek-R1在确保每位用户能够达到20 TPS（每秒事务数）的基础上，单卡Decode的吞吐量更是突破了1920 Tokens/s，这一表现与H100的部署性能不相上下。更重要的是，经过广泛的主流测试集验证及大规模线上盲测，使用昇腾算力部署的DeepSeek-R1模型精度，与DeepSeek官方提供的版本完全一致。

CloudMatrix超节点集群，凭借其基于新型高速总线架构的设计，在总算力、互联带宽以及内存带宽方面均处于业界领先地位。这一创新架构，为DeepSeek-R1的高效运行提供了坚实的基础。

硅基流动此前已在SiliconCloud大模型云服务平台上，推出了基于昇腾云的稳定生产级DeepSeek-V3与R1推理服务，并支持模型的私有化集群部署。此次与华为云的深度合作，进一步推动了基于国产算力的DeepSeek-R1推理服务的持续优化与升级。

DeepSeek在全球范围内掀起了一场风暴，其高效、低成本的MoE（Mixture of Experts，专家混合）架构为解决大模型推理的挑战提供了新的思路。然而，要想成功部署DeepSeek，并非易事，尤其是缺乏强大的AI Infra技术能力的情况下。DeepSeek采用了大规模专家并行（Expert Parallelism，大EP并行）的MoE模型架构，如果采用单机部署方案，其性能将远逊于DeepSeek官方公布的部署方案，且成本差距可能高达数倍。

面对这些挑战，硅基流动与华为云共同攻克了技术难关。在CloudMatrix 384超节点昇腾云服务上部署DeepSeek-R1时，他们采用了大规模专家并行方案，通过多专家负载均衡和极致的通信优化，实现了高吞吐和更高性能，从而显著提升了用户体验。同时，他们还利用了昇腾高性能算子库以及硅基流动推理加速框架SiliconLLM在模型、机制、算子上的协同优化，使得在国产算力上，DeepSeek-R1的推理效率与资源利用率得到了显著提升，且未损失模型精度。

硅基流动与华为云的这次合作，不仅为用户提供了坚实的全国产软硬件体系部署方案，使DeepSeek推理服务更加经济高效，同时也展示了AI生态合作的强大力量。这一合作成果，将推动AI技术在更多场景中的落地和应用，为用户带来更加优质的AI服务体验。

举报 0 收藏 0 打赏 0评论 0

更多>同类资讯

华为Pura X小艺智能体升级，沉浸式对话体验，让交流更自然

04-12

OpenAI前首席科学家创办公司获20亿融资，估值飙升至320亿美元

04-12

贾跃亭债务再增8.3亿，总金额超13亿，何时回国仍成谜

04-12

国行iPhone将迎AI大升级！苹果携手阿里百度，年中前亮相

04-12

苹果AI落后内幕：预算削减与内部争斗成关键阻碍

04-12

PDEM测评揭晓：宠智灵领跑，加速宠医AI从辅助查询到智能诊断的进化之路

回望过去十年，人工智能在宠物医疗领域的应用经历了从边缘到中心的深刻变革。早期，AI更多扮演着信息检索、文献辅助的角色。而今，以大语言模型为核心的宠医AI正尝试深入临床诊疗的核心环节——诊断与决策支持。刚刚发布的宠医行业AI大模型测评(PDEM)结果，恰似一个快照

04-12

英伟达推出Nemotron Ultra：2530亿参数大模型，突破AI推理与部署效率

04-12

华为Pura X新升级！小艺智能体：沉浸式对话，像真人般交流

04-12

蚂蚁集团AI大将徐鹏离职，曾掌舵蚂蚁百灵大模型研发

蚂蚁集团副总裁、前基础大模型负责人徐鹏已离职。徐鹏一直从事人工智能领域技术研究，曾在谷歌工作11年，负责和领导了谷歌翻译的核心技术研发，并参与了谷歌显示广告系统的算法研发。此前蚂蚁成立AI创新研发与应用部门N…

04-12

全新智能Siri或将随iOS 19亮相，苹果AI再升级！

04-12

苹果AI发展滞后真相：预算削减与内部斗争成主因

04-12

Ilya Sutskever新公司获20亿融资，估值飙升至320亿美元

据报道，知情人士透露，OpenAI联合创始人Ilya Sutskever为自己的AI初创公司SafeSuperintelligence融资20亿美元，公司估值达到320亿美元。参与这一轮投资的包括Gree…

04-12

联发科天玑9400+发布：旗舰AI芯片，端侧推理能力超越云端大模型

04-12

华为云生态大会启幕：开发者破千万，鸿蒙生态伙伴壮大至4.5万+

04-12

AI如何助力医疗养老，填补长寿时代服务缺口？

在2025年（第七届）世界大健康博览会上，泰康保险集团、泰康长寿时代研究院联合主办了2025长寿时代论坛，聚焦于AI技术发展能在人口老龄化过程中怎样填补空白、如何重塑服务路径。对于AI技术目前在医养行业中…

04-11

点击查看更多 +

全站最新

谷歌Gemini曝光新技能：圈屏精搜，搜索体验再升级？

鸿蒙生态再添利器！新华字典App鸿蒙版正式上线

三星Galaxy Ring智能戒指充电盒上架，89.99美元价格遭用户吐槽

华为Pura X小艺智能体升级，沉浸式对话体验，让交流更自然

iPhone 17 Pro设计大变！铝合金玻璃拼接，镜头模组横向大矩阵布局曝光

零跑C16限时特惠来袭！叠加多重福利，起售价低至11.8701万元

热门内容

本栏最新

贾跃亭债务再增8.3亿，总金额超13亿，何时回国仍成谜

苹果AI落后内幕：预算削减与内部争斗成关键阻碍

英伟达推出Nemotron Ultra：2530亿参数大模型，突破AI推理与部署效率

华为Pura X新升级！小艺智能体：沉浸式对话，像真人般交流

全新智能Siri或将随iOS 19亮相，苹果AI再升级！

Ilya Sutskever新公司获20亿融资，估值飙升至320亿美元

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.