近日,人工智能领域迎来了一次引人瞩目的更新。DeepSeek团队在开源平台上低调发布了其最新版本的模型——DeepSeek-V3,版本号为DeepSeek-V3-0324。据悉,这一新版本模型的参数规模达到了6850亿,相较于之前的6710亿参数版本,有了小幅度的提升。
尽管DeepSeek尚未公布新版模型的系统卡信息,但开源地址https://huggingface.co/deepseek-ai/DeepSeek-V3-0324已经开放,供开发者下载和测试。值得注意的是,DeepSeek-V3的开源协议也进行了更新,与DeepSeek-R1一致,采用了更为宽松的MIT协议。这一变化意味着开发者将拥有更多的自主权,包括进行模型蒸馏和商业应用等。
据多位已经体验过新版模型的网友反馈,DeepSeek-V3在代码、数学等多个方面展现出了显著的性能提升。一位海外AI领域的知名博主甚至表示,DeepSeek-V3终于有能力在代码领域与Anthropic的Claude Sonnet 3.5一较高下了。此前,Claude Sonnet 3.5在程序员群体中享有极高的声誉,是许多程序员的首选模型。
在实际测试中,新版DeepSeek-V3的表现同样令人印象深刻。在网站开发和UI设计方面,它展现出了巨大的进步。当输入“设计一个美观的个人博客网站,带有科技感,直接开发成可用网页”的提示词后,DeepSeek-V3在短短2分钟内就交付了一个总计400多行代码、设计精良的网站。该网站采用了粒子背景动画、赛博朋克风格的UI设计元素,以及打字机动画和光波扩散效果的按钮等,整体效果非常出色。
相比之下,旧版DeepSeek-V3在相同指令下的解决方案就显得逊色不少,不仅在代码量上大幅减少,而且在审美上也与新版存在明显差距。在数学方面,新版DeepSeek-V3同样展现出了不俗的实力。尽管在面对某些复杂数学问题时,它的答案仍然有误,但值得注意的是,如今的DeepSeek-V3在给出最终答案后,会进行一定程度的反思,并尝试修改自己的解题过程,这显示出其在学习和进步方面的能力。
新版DeepSeek-V3在文科类问题上的表现也有所提升。在回答关于“布须曼人喝不喝牛奶?”的问题时,它采用了更为结构化的回答模式,提供了更为全面和详细的背景信息,同时生成速度仍然保持得相当理想。这一变化让不少网友感叹,新版DeepSeek-V3就像是V3与R1的结合体,更倾向于用长输出来解决问题。