ITBear旗下自媒体矩阵:

金山云适配国产芯片,DeepSeek满血版多机部署助力AI加速落地

   时间:2025-03-07 16:25:28 来源:ITBEAR编辑:快讯团队 发表评论无障碍通道

金山云近期宣布了一项重要进展,成功完成了基于国产芯片的DeepSeek满血版的适配工作。这一突破性的成就不仅彰显了金山云在技术创新方面的实力,也为人工智能领域注入了新的活力。

与此同时,金山云的星流训推平台也迎来了重大更新,正式部署了DeepSeek满血版,并支持多机部署以实现分布式推理。这一功能的加入,将为用户提供更为强大且高效的算力支持,助力模型在自然语言处理、智能问答、文本生成等多个领域展现卓越性能。

为了方便用户快速部署DeepSeek满血版,金山云在搭载国产GPU的裸金属机型上进行了深度适配,并提供了预装好的自定义镜像。用户只需在金山云裸金属服务器控制台进行简单操作,选择地域与机型、选定内置DeepSeek满血版的自定义镜像,并完成网络与安全配置及基本信息设置,即可轻松完成部署。这一流程大大简化了部署步骤,降低了模型的使用门槛。

据金山云介绍,DeepSeek满血版在搭载国产GPU的裸金属机型上展现出了卓越的性能。在智能客服等场景中,它能够快速理解用户的复杂问题,并给出准确且人性化的回答。与其他同类模型相比,DeepSeek满血版在语义理解的准确性和文本生成的流畅性方面具有显著优势,为各行业的智能化升级提供了有力支撑。

为了进一步加速企业AI规模化落地,金山云推出了模型在线服务功能。这一服务涵盖了从模型部署到调用的全过程,聚焦高效部署与分布式推理协同。通过智能任务调度与跨节点并行计算,金山云模型在线服务平台能够实现模型的高效推理。用户无需进行复杂配置,即可在公有云环境构建稳定、高性价比的模型服务。

值得注意的是,金山云星流训推平台此前已支持DeepSeek蒸馏版的部署,而此次更新则新增了对DeepSeek满血版多机部署的支持。多机部署的实现,将进一步提升模型的推理能力和处理效率。

在进行多机部署时,用户只需进入算力平台控制台创建资源池,并进入模型在线服务导航页点击新建,即可开始创建模型在线服务。用户可以根据需求选择R1或V3模型,并自主配置服务副本数以及多机部署的节点数量。填写完基本信息、资源、网络等配置后,点击确认即可开始部署模型。虽然R1、V3模型部署所需时间较长,但等待是值得的,因为这将为用户带来更为强大且高效的模型服务。

模型部署成功后,用户即可对模型进行调用。金山云当前支持接口和WebUI两种调用方式。通过接口调用方式,用户可以轻松实现模型的远程调用;而通过WebUI调用方式,用户则可以在模型部署成功后点击模型名称进入模型概览页,点击访问WebUI即可通过Web界面实现模型调用。首次进入WebUI页面需注册用户账号,注册完成后登录即可使用界面进行模型调用。

金山云的这一系列举措,无疑将为用户带来更为便捷、高效的人工智能体验。未来,随着技术的不断进步和应用场景的不断拓展,金山云将继续致力于技术创新和服务升级,为用户提供更加优质的人工智能解决方案。

举报 0 收藏 0 打赏 0评论 0
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  RSS订阅  |  开放转载  |  滚动资讯  |  争议稿件处理  |  English Version