ITBear旗下自媒体矩阵:

上海交大携手昇腾,DeepSeek大模型满血上线,加速自主创新步伐!

   时间:2025-02-18 12:25:09 来源:ITBEAR编辑:快讯团队 发表评论无障碍通道

上海交通大学近日宣布,该校已成功实现了DeepSeek全系列模型在昇腾Atlas 800T A2算力集群上的本地化部署,这一壮举标志着该校成为国内首个完成千亿级大模型全栈国产化部署的高等学府。此次部署覆盖了DeepSeek系列中的多个核心模型,如DeepSeek-R1和DeepSeek-V3,它们将广泛应用于教学、科研、管理以及服务等多个领域,为上海交通大学的人工智能基础设施建设开启了新的篇章。

此次成功的背后,离不开昇腾先进架构所提供的卓越性能以及原厂服务FAE的鼎力支持。这些关键因素共同为DeepSeek系列模型提供了强大的算力支撑。针对高校这一特殊应用场景,上海交通大学与昇腾携手实现了三大技术上的重大突破:

首先,在轻量化推理架构方面,通过昇腾Ascend核间通信优化技术,仅使用4台Atlas 800服务器便能承载DeepSeek-R1和DeepSeek-V3这两个拥有千亿参数的模型进行推理,硬件投入成本因此降低了65%。这一突破为高效利用资源、降低成本提供了有力保障。

其次,在动态资源调度方面,借助昇腾AI原生算力平台,上海交通大学实现了针对不同应用场景的算力弹性分配。无论是教学、科研还是管理和服务场景,都能根据实际需求灵活调配算力资源,从而提高了资源利用率。

再者,在全栈自主可控方面,从昇腾处理器到MindSpore框架的深度适配,使得DeepSeek-V3在复杂数学推理任务中的端到端时延相比传统方案有了显著改善。这一突破进一步增强了模型在处理复杂任务时的效率和稳定性。

得益于华为昇腾的独特优势,DeepSeek系列模型在推理效率上得到了显著提升,同时成本也大幅降低。2025年2月4日,DeepSeek-V3、DeepSeek-R1以及Janus-Pro正式登陆华为昇腾社区,用户只需一键操作即可获取这些先进的模型。

即日起,上海交通大学的师生们可通过网页或APP申请体验“满血版”的DeepSeek系列模型,无需再担心深度思考功能受限或对话提问无响应的问题。同时,上海交通大学鲲鹏昇腾科教创新卓越中心也将积极推动DeepSeek系列模型与课程设计、科研创新等方面的深度融合,探索在AI技术加持下的全新学习与科研范式。

作为基于鲲鹏昇腾技术路线的校级生态合作平台,鲲鹏昇腾科教创新卓越中心在校企合作、产教融合方面发挥着举足轻重的作用。该卓越中心将持续推动DeepSeek等重要AI创新成果在高校领域的落地应用,进一步将人工智能技术融入师生们的日常生活、学习和科研之中,引领他们勇攀世界科技高峰。

举报 0 收藏 0 打赏 0评论 0
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  RSS订阅  |  开放转载  |  滚动资讯  |  争议稿件处理  |  English Version