滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

联想AMD联手！AI服务器单机部署大模型，吞吐量破6700 token/s新纪录！

时间：2025-03-17 15:29:51 来源：ITBEAR编辑：快讯团队 发表评论无障碍通道

联想今日宣布，其首款采用AMD技术的AI大模型训练服务器——联想问天WA7785a G3，在单机部署671B（即满血版）DeepSeek大模型时，成功实现了6708 token/s的极限吞吐量，刷新了单台服务器运行大模型的性能记录。这一成就不仅彰显了联想在AI基础设施领域的深厚技术积累和快速研发响应能力，更在AI算力竞争日益激烈的当下，以卓越的技术实力树立了新的行业标杆。

联想问天WA7785a G3服务器之所以能够达到如此高的性能，得益于联想万全异构智算平台的强大支持。该平台通过一系列创新手段，如访存优化、显存优化、PCIe 5.0全互联架构创新以及精选SGLang框架中性能最优的算子，对大模型从预训练到推理的全过程进行了深度优化。在实测中，该服务器在部署DeepSeek 671B大模型时，最高吞吐量达到了6708 token/s。

在具体应用场景中，联想问天WA7785a G3同样表现出色。在模拟问题对话场景（上下文序列长度分别为128和1K）时，该服务器最高可支持158个并发用户，TPOT为93毫秒，TTFT为2.01秒。而在模拟代码生成场景（上下文序列长度分别为512和4K）时，并发数可达140，TPOT为100毫秒，TTFT为5.53秒。这一性能水平意味着，单台联想问天WA7785a G3服务器足以支撑1500人规模企业的正常使用。

此次性能突破的背后，是联想中国基础设施业务群、联想研究院ICI实验室与AMD的深度合作与协同调优。双方联合设计、共同实现了这一突破，并仍在持续探索深度调优的新方法，以期实现更高的性能突破。这一合作不仅体现了联想与AMD在技术创新上的紧密合作，更展示了双方在AI算力领域的领先地位。

联想问天WA7785a G3服务器的卓越性能，离不开其硬核的硬件配置。该服务器搭载了2颗AMD处理器和8颗AMD新一代Instinct OAM GPU，这些强大的算力引擎为大模型训练、推理等场景提供了坚实的支持。同时，WA7785a G3还拥有超大的显存容量，单颗GPU的HBM3e显存容量高达192GB，总计达1.5TB。这一超大显存使得单机在支持全量模型推理时，仍能保持充足的KV缓存空间，满足大模型并行计算时对跨节点通信的高带宽需求。

联想问天WA7785a G3的独特架构设计也为其卓越性能提供了有力保障。该服务器采用三重独立风道设计，分别针对CPU节点、GPU节点和交换机节点进行精准散热控制，提高了散热效率，确保了服务器的稳定性和可靠性。这一设计不仅有助于最大程度地释放算力潜能，还突破了带宽限制，使得联想问天WA7785a G3成为用户首选的大模型推理服务器。

举报 0 收藏 0 打赏 0评论 0

更多>同类资讯

星计划集团筹拍《西游记》动画三部曲，八戒率先登场引领超现实神话宇宙！

03-17

零一万物一站式平台助力DeepSeek企业级部署，加速大模型产业落地

03-17

中美AI大模型成本战：百度DeepSeek性价比高，OpenAI何去何从？

03-17

李开复：零一万物推企业大模型平台，告别超大基座模型迭代之路

我觉得，过去可能碰到的一些挑战是，中国真的还没有所谓的ChatGPT，大家还是做项目，百度模型我怎么用，然后不是很高的价钱去做招标，最后模型厂商也赚不了那么多钱，赋能价值也不见得是足够的大，但今天的差别就是说…

03-17

DeepSeek助力跨境B2B新飞跃，外贸长效增长还需哪些硬功夫？

在钛媒体和RollingAI联合发布的「DeepSeek落地场景适用性指南」中，通过将DeepSeek和目前主流大模型在十大主要场景中的适用性测试得出，由于DeepSeek的强推理能力，在医疗、金融、教育等…

03-17

小米大模型团队突破音频推理，强化学习助力登顶MMAU榜首！

03-17

零一万物发布万智企业大模型平台，李开复：去年收入破亿，全面拥抱DeepSeek

零一万物首发面向企业客户提供企业级DeepSeek 部署定制解决方案，涵盖了DeepSeek模型部署、应用实践以及模型微调工具。其次，在应用实践方面，该平台为企业提供了包含联网搜索、知识库、深度研究、智能…

03-17

百川智能两位联合创始人离职，分别投身AI语音与AI Coding创业热潮

据蓝鲸新闻，从多位知情人士处独家获悉，大模型六小虎之一的百川智能创始团队出现变动，其中，联合创始人焦可已经离职，另一位联合创始人陈炜鹏也将离职，目前还在走内部流程。另一位联合创始人陈炜鹏在百川智能期间主要负…

03-17

苹果高管齐聚，AI危机能否在本周会议找到解药？

03-17

微软量子计算机研发之路：曾遭CEO否定，成果真实性引争议

03-17

华为申请“MATEROBOT”商标，或将进军人形机器人领域

03-17

AI新时代：多智能体协同，小模型引领商业成功之路

03-17

景联文科技联手长望智创，共铸国防智能化新篇章！

03-17

2025 InsunICC学术研讨会：哈工大深圳聚焦智能计算前沿探索

03-17

马蜂窝腾讯云强强联合，DeepSeek赋能“AI游贵州”引领旅游智能化新风尚

03-17

点击查看更多 +

全站最新

宝马携手华为，深度融入鸿蒙生态，智能出行新体验即将开启

微星MEG Ai1600T PCIE5电源上市：1600W钛金效能，轻松驾驭RTX 50，终身质保

华硕NUC 15 Pro迷你机来袭！双雷电4接口，性能强劲仅售4399元起

量子之歌Q2净利增长近两成，多元化战略重塑在线教育商业版图

虾仁保水剂超标！五斤解冻变半斤，消费者如何安心选购？

小鹏G9全系标配高性价比，对比智界R7，谁更值得你的选择？

热门内容

本栏最新

星计划集团筹拍《西游记》动画三部曲，八戒率先登场引领超现实神话宇宙！

零一万物一站式平台助力DeepSeek企业级部署，加速大模型产业落地

中美AI大模型成本战：百度DeepSeek性价比高，OpenAI何去何从？

李开复：零一万物推企业大模型平台，告别超大基座模型迭代之路

零一万物发布万智企业大模型平台，李开复：去年收入破亿，全面拥抱DeepSeek

苹果高管齐聚，AI危机能否在本周会议找到解药？

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.