滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

浪潮信息元脑R1服务器：单机承载DeepSeek R1 671B大模型推理新突破

时间：2025-02-12 12:06:15 来源：ITBEAR编辑：快讯团队 发表评论无障碍通道

浪潮信息近日震撼发布元脑R1推理服务器，该服务器凭借系统级创新与软硬件深度协同，成功实现了对DeepSeek R1 671B全参数基础大模型的单机部署与运行。这一突破，标志着AI推理能力迈上了新的台阶。

DeepSeek开源的多版本模型中，R1 671B以其强大的泛化能力、高精度及卓越的上下文理解能力脱颖而出，但同时也对计算资源提出了前所未有的挑战。特别是在FP8精度下，该模型需要至少800GB的显存容量，而在FP16/BF16精度下，则需超过1.4TB的显存空间。DeepSeek R1作为长思维链模型的代表，其推理解码阶段对显存带宽和低通信延迟有着极高的要求。

针对这些挑战，元脑R1推理服务器NF5688G7应运而生。该服务器原生配备了FP8计算引擎，并搭载了1128GB的HBM3e显存，完美满足了DeepSeek R1 671B模型在FP8精度下的显存需求。即使在全量模型推理的情况下，NF5688G7仍能保留足够的KV缓存空间，其显存带宽更是高达4.8TB/s。在通信方面，GPU间的P2P带宽达到了900GB/s，基于最新的推理框架，单机即可支持20-30用户的并发需求。NF5688G7还配备了3200Gbps的无损扩展网络，可根据业务需求灵活扩展，为用户提供R1服务器集群的即插即用解决方案。

而另一款专为大型推理模型设计的元脑R1推理服务器NF5868G8，则以其高吞吐性能惊艳亮相。该服务器首次实现了单机支持16张标准PCIe双宽卡，提供了最高1536GB的显存容量，能够在FP16/BF16精度下单机部署DeepSeek 671B模型。NF5868G8采用了基于PCIe Fabric的16卡全互连拓扑结构，任意两张卡之间的P2P通信带宽均可达到128GB/s，通信延迟降低了超过60%。通过软硬件的深度协同优化，相比传统的2机8卡PCIe机型，NF5868G8在DeepSeek 671B模型的推理性能上提升了近40%，并已支持多种AI加速卡的选配。

浪潮信息的这一系列创新，不仅展现了其在AI推理领域的深厚实力，更为AI大模型的应用落地提供了强有力的支撑。未来，随着AI技术的不断发展，元脑R1推理服务器有望成为推动AI行业进步的重要力量。

举报 0 收藏 0 打赏 0评论 0

更多>同类资讯

BBC调研：AI新闻总结乱象频现，事实观点混为一谈？

02-12

苹果携手阿里，在中国推出Apple Intelligence？

Apple was reported in December it had formally partnered with Baidu tolaunch Apple Intelligence in Chi…

02-12

AI依赖症？微软研究：过度使用或让人失去批判性思维

02-12

苹果携手马云，国行iPhone AI功能即将落地？

02-12

国行iPhone将迎阿里AI，智能化功能上线指日可待？

02-12

Meta股价16连涨，市值直逼2万亿，AI投资热潮下的新“明珠”？

02-12

Klook获1亿美元融资，深耕亚太旅游体验，2025旅游业复苏新动力？

02-12

猿辅导全系列小猿产品融合DeepSeek大模型，升级青少年AI学习体验

02-12

阿里股价大涨6%，携手苹果为中国iPhone用户打造AI新功能？

02-12

三星S25系列国行震撼登场：骁龙8至尊版+2亿像素主摄引领新潮流

02-12

索尼打击低质游戏成效几何？漏网之鱼仍存引关注

02-12

苹果应用商店免费榜：AI大模型应用占据半壁江山？

三言科技消息三言科技发现，今日的苹果应用商店免费排行榜中，前10名里有5款是AI大模型应用。排在首位的是DeepSeek，其次是红果短剧、纳米AI搜索、云闪付、夸克、Kimi等。其中DeepSeek已收…

02-12

极狐阿尔法S5智能座舱再升级，4月OTA更新将上线DeepSeek大模型

02-12

马斯克收购OpenAI？奥特曼：董事会尚未见官方文件

02-12

美国首例！汤森路透胜诉，AI版权纠纷案尘埃落定

02-12

点击查看更多 +

全站最新

冯兴亚领航广汽新征途：战略转型加速，行业格局待重塑

电动化浪潮下，捷豹路虎如何续写豪华新篇章？

比亚迪海豹05DM-i智驾版上市，7.98万起售，高阶智驾普及新选择！

大S离去，麻六记的流量密码还灵吗？

长安破局：激光雷达走入寻常百姓车，智能驾驶不再是奢侈品？

长安东风汽车重组：央企整合大幕拉开，未来格局如何变？

热门内容

本栏最新

AI依赖症？微软研究：过度使用或让人失去批判性思维

苹果携手马云，国行iPhone AI功能即将落地？

国行iPhone将迎阿里AI，智能化功能上线指日可待？

Meta股价16连涨，市值直逼2万亿，AI投资热潮下的新“明珠”？

Klook获1亿美元融资，深耕亚太旅游体验，2025旅游业复苏新动力？

阿里股价大涨6%，携手苹果为中国iPhone用户打造AI新功能？

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.