滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

联想AI服务器新突破：本地部署DeepSeek大模型，性能满载支持百并发

时间：2025-03-03 12:31:34 来源：ITBEAR编辑：快讯团队 发表评论无障碍通道

联想集团近日宣布了一项重大技术突破，成功在联想问天WA7780 G3服务器上单机部署了DeepSeek-R1/V3 671B大模型。这一成就不仅刷新了企业级大模型部署的基准，还以远低于行业公认的1TGB显存要求（实际仅使用768GB），实现了流畅支持100并发用户的能力，充分满足千人以上规模企业的使用需求。

在DeepSeek大模型本地化部署逐渐成为企业关注焦点的背景下，联想的这次技术革新为企业提供了宝贵的选型参考。面对行业普遍存在的关键问题，如单机能否部署完整版的DeepSeek R1、最低配置需求、高并发与吞吐量下的用户体验保障以及如何避免采购陷阱，联想给出了明确的答案。

联想的研发团队通过一系列创新技术，包括专家并行优化、智能访存架构升级以及PCIe 5.0全互联架构的应用，显著提升了显存利用率，从而实现了性能的大幅提升。在512 token标准测试环境下，系统能够支持100个并发用户以每秒10 token的速度稳定输出，首token响应时间更是被压缩至30秒以内。即使在面对4K长序列的复杂场景时，系统也能保持25个并发用户的同等性能。

联想问天WA7780 G3服务器仅配置了8张96GB显存的GPU卡，而DeepSeek-R1大模型的模型参数就占据了约700GB显存，剩余显存空间有限。如果不进行专门优化，系统仅能支持2至3个用户接入。然而，在联想万全异构智算平台的加持下，通过精心优化，联想成功实现了用户体验的三项关键指标：首token延迟小于30秒、单token延迟小于100毫秒、支持2K以上长序列问题处理。同时，这一方案还实现了20%以上的成本节约，充分展示了联想在服务器技术领域的深厚积累和创新实力。

联想的这一创新成果不仅为企业提供了设备选型的新思路，还提醒企业在评估测试数据时，应审慎看待总吞吐量和总并发数等指标，而应更加关注用户体验和数据精度等隐藏信息。例如，将数据精度从FP8转为int8或int4（即量化）虽然可以显著提升性能表现，但会牺牲结果的准确性，这显然不是用户所期望的。高吞吐量和高并发量也并不等同于用户体验好。如果服务器GPU卡配置不高，局部通信瓶颈可能会引发响应延迟，导致用户体验降级。

联想的这一技术突破将有效破除大模型在企业落地过程中的瓶颈，加速大模型在企业的应用进程。未来，联想基础设施业务群与联想研究院先进计算实验室将继续深化合作，依托联想万全异构智算平台对DeepSeek平台从AI预训练、后训练到推理的全流程进行持续优化，为客户提供性能更佳、性价比更高的产品和解决方案，推动DeepSeek大模型的广泛落地，引领新一轮的生产力革命。

举报 0 收藏 0 打赏 0评论 0

更多>同类资讯

RunningHub携FramePack插件，开启长视频创作无硬件限制新纪元

04-18

闲鱼AI新突破：超级智能体引领闲置交易革命

04-18

用友BIP新品重磅发布：智驱制造，助力企业质优本降效增！

04-18

联想创新科技大会：揭秘AI新品，人形机器人或成数字生活新桥梁？

04-18

食博会·预博会和农博会东莞启幕，AI智慧农食展新风采！

04-18

测测达人携手FARMER BOB：春日治愈行动，让情绪找到回响

04-18

闪迪创作者系列全新上市，专业存储方案赋能内容创作者高效产出

04-18

AI造游戏，路还长吗？

04-18

智谱AI获多方青睐，北京基金再追投2亿助力开源生态建设

04-18

智平方AlphaBot 2升级亮相：DeepSeek技术赋能，开启通用智能新篇章

04-18

谷歌Gemini 2.5 Flash突破性发布：成本大幅降低，性能依旧强劲

04-18

关税风暴中，全球AI产业如何破局前行？

此外，由于对等关税大棒给全球经济体都造成了冲击，由此产生对美国技术生态体系的不信任，或许也是一个中国AI合纵连横的窗口期，来增强中国AI技术生态的韧性，比如，吸引海外开发者使用国产化AI框架、开发工具、AI…

04-18

银行业科技投入分化，大模型应用深度融入核心业务成亮点

对此，钛媒体App重点梳理了10家银行（包括国有六大行和招行、中信、平安、兴业4家股份行）财报，以此一窥国内头部银行的最新科技故事。总的来说，虽然智能客服、代码助手等已是普遍应用，但上述银行在专业领域的深…

04-18

讯飞双屏翻译机2.0新品发布：智能升级，让跨境沟通无界高效！

04-18

萝卜快跑海南布局再落一子，新公司注册资本达百万

04-18

点击查看更多 +

全站最新

宝马中国CEO高翔上海车展前瞻：新世代战略与安全坚守并重

雷克萨斯独资建厂，能否在新能源赛道上重塑辉煌？

海陆空全能王！比亚迪海狮07DM-i智驾版预售仅18.98万起

长安Lumin 2025款双车升级，A00纯电市场迎来新标杆！

一加13T小屏新体验：李杰力赞单手操作无压力

零刻ME mini迷你机首发，搭载英特尔N200，六盘位存储仅售1295元！

热门内容

本栏最新

闲鱼AI新突破：超级智能体引领闲置交易革命

用友BIP新品重磅发布：智驱制造，助力企业质优本降效增！

联想创新科技大会：揭秘AI新品，人形机器人或成数字生活新桥梁？

食博会·预博会和农博会东莞启幕，AI智慧农食展新风采！

测测达人携手FARMER BOB：春日治愈行动，让情绪找到回响

闪迪创作者系列全新上市，专业存储方案赋能内容创作者高效产出

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.