ITBear旗下自媒体矩阵:

华为DeepSeek系列模型登陆昇腾社区,一键获取开启AI新篇章!

   时间:2025-02-05 19:18:27 来源:ITBEAR编辑:快讯团队 发表评论无障碍通道

华为近日正式宣布,其DeepSeek系列中的DeepSeek-R1、DeepSeek-V3、DeepSeek-V2以及Janus-Pro模型已在昇腾社区上线。这一系列举措意味着用户现在可以一键获取DeepSeek系列模型,并且在昇腾硬件平台上实现开箱即用的便捷体验。

据悉,DeepSeek-V3模型早在2024年便推出了首个版本,并同步进行了开源。作为一款自研的MoE模型,DeepSeek-V3拥有671B的参数,其中37B被激活,并在14.8T的token数据上进行了预训练。这样的配置使其在多个评测中展现出了卓越的性能。

DeepSeek方面透露,DeepSeek-V3在多项评测中的表现已经超越了Qwen2.5-72B和Llama-3.1-405B等其他知名的开源模型。更令人瞩目的是,在性能上,DeepSeek-V3与世界顶尖的闭源模型,如GPT-4o和Claude-3.5-Sonnet,也达到了相当的水平。这一成就无疑进一步提升了DeepSeek系列模型在行业内的地位和影响力。

为了帮助用户更好地在昇腾社区获取和使用DeepSeek-V3模型,以下将详细介绍具体的操作步骤。以DeepSeek-V3为例,用户首先需要确保满足硬件要求,即部署该模型需要配置4台Atlas 800I A2(8*64G)服务器资源。

接下来是模型调用的实践环节。用户需要完成权重转换,尽管原文中GPU和NPU的具体转换步骤未详细列出,但用户可以在昇腾社区找到相关的指导文档。完成权重转换后,用户需要从昇腾社区的开发资源中下载适配DeepSeek-V3的镜像包,具体为mindie:1.0.T71-800I-A2-py311-ubuntu22.04-arm64。下载完成后,使用docker images命令来查找并确认具体的镜像名称与标签。

服务化测试是最后一步。用户需要配置服务化环境变量,并启用内存池扩展段功能,即虚拟内存特性。完成服务化参数的修改后,用户可以拉起服务化。当屏幕上出现“Daemon start success!”的提示时,即表示服务已经成功启动。

通过以上步骤,用户就可以在昇腾社区高效地获取并使用DeepSeek-V3模型了。这一流程的简化和优化,无疑将进一步提升DeepSeek系列模型在行业内的普及度和应用率。

举报 0 收藏 0 打赏 0评论 0
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  RSS订阅  |  开放转载  |  滚动资讯  |  争议稿件处理  |  English Version