近日,烽火通信科技股份有限公司传来消息,其子公司长江计算携手昇腾与华为云团队,成功为某大型国有银行部署了DeepSeek-V3大模型的本地化推理服务。这一合作标志着长江计算在AI推理服务领域取得了重要进展。
此次部署的核心设备是长江计算自主研发的G440K V2服务器。该服务器在华为云AI开发平台ModelArts的助力下,基于MindIE推理引擎,顺利完成了DeepSeek-V3大模型的推理服务部署。这一过程中,长江计算的技术实力得到了充分展现。
G440K V2服务器不仅在硬件设计上独具匠心,更在软件层面实现了对DeepSeek系列模型的深度适配与优化。其采用的8模组高效推理架构,为AI推理提供了强大的算力支持,确保了DeepSeek大模型在处理复杂任务时的流畅与高效。
据长江计算方面介绍,G440K V2服务器在内存带宽和互联能力方面具有显著优势。这些特性使得该服务器在部署DeepSeek系列模型时,能够大幅提升模型推理速度、响应效率和数据处理能力。同时,该服务器还支持多机组网推理,进一步满足了大型银行对于高性能、高可用性的需求。
目前,G440K V2服务器已在智能客服、文案生成、知识沉淀等多个大模型推理场景中得到了广泛应用。这些应用不仅提升了银行业务处理的智能化水平,还确保了部署过程中的数据安全与自主可控。长江计算与昇腾、华为云团队的紧密合作,无疑为金融行业AI推理服务的发展注入了新的活力。