在开源技术的浩瀚星空中,一颗新星正以前所未有的速度闪耀——DeepSeek,它在Hugging Face社区中的受欢迎程度近日达到了前所未有的高度。据最新数据显示,DeepSeek在该平台的点赞数已突破8730次大关,并且这一数字仍在持续攀升,成功登顶Hugging Face点赞榜。
这一成就,是继DeepSeek应用在美国App Store免费榜上超越ChatGPT,以及在GitHub上的Star数超过OpenAI之后,DeepSeek创造的又一个里程碑。这一系列壮举,无疑让DeepSeek在全球大模型产业的舞台上,再次占据了举足轻重的地位。
在Hugging Face的点赞榜前十名中,每一个模型都曾在某个时刻引领了整个大模型产业的发展潮流。紧随DeepSeek之后的是FLUX.1,这个由StableDiffusion原团队打造的新作,以AI生图“新王”的姿态横空出世,目前点赞数已接近8710次。而排名第六的,则是由全球1000名科学家共同打造的超大NLP模型BLOOM,其参数量高达1760亿个。欧洲AI独角兽Mistral AI的Mixtral-8x7B模型也榜上有名,位列第八。
meta的Llama系列模型和StabilityAI家的模型在榜单中占据了多个席位,展现出了强大的实力。然而,OpenAI的语音转录模型Whisper-large-v3却未能进入前十,目前排名第11,点赞数约为3810次。相比之下,DeepSeek的另一款模型——DeepSeek-V3,虽然排名在第19位,但其点赞数同样达到了约3810次,成功超越了微软的Phi-2和谷歌Gemma-7B模型。
除了DeepSeek-V3之外,DeepSeek的另一款开源多模态模型Janus-Pro-7B也在Hugging Face的点赞榜上名列前茅,位列前30。这款模型在文本提示的图像生成排行榜中表现优异,甚至超越了OpenAI的DALL-E 3和Stability AI的Stable Diffusion。这无疑进一步证明了DeepSeek在多模态理解和视觉生成方面的卓越能力。
回顾DeepSeek的近期发展,DeepSeek V3、DeepSeek R1以及Janus-Pro-7B等模型的相继发布,无疑为DeepSeek的崛起奠定了坚实的基础。其中,DeepSeek V3作为DeepSeek自研的MoE模型,参数量高达671B,激活参数量37B,在14.8T token上进行了预训练。该模型在多项评测中超越了Qwen2.5-72B和Llama-3.1-405B等开源模型,并在性能上与闭源模型GPT-4o以及Claude-3.5-Sonnet不相上下。
而DeepSeek R1则在数学、代码、自然语言推理等任务上展现出了强大的性能,与OpenAI o1正式版比肩。在发布DeepSeek-R1-Zero和DeepSeek-R1两个660B模型的同时,DeepSeek还蒸馏了6个小模型,其中32B和70B模型在多项能力上实现了对标OpenAI o1-mini的效果。这些成果不仅展示了DeepSeek在技术创新方面的实力,也为其在全球范围内的广泛应用奠定了坚实的基础。
随着全球芯片企业、云计算巨头以及各路基础设施公司纷纷适配、接入DeepSeek,DeepSeek所展现出的卓越性能与广泛的应用潜力正在逐渐放大。可以预见的是,在未来的日子里,DeepSeek将继续在大模型产业的舞台上发光发热,引领着整个行业向更加美好的未来迈进。