近日,DeepSeek-V3模型迎来了其最新的小版本更新,版本号被标记为DeepSeek-V3-0324。官方于昨晚详细披露了此次升级的具体内容,为用户带来了全新的使用体验。
据官方公告,此次更新后的DeepSeek V3模型,用户只需在官方网页、App以及小程序中关闭深度思考功能,即可直接体验。而API接口的使用方式则保持原样,无需任何改动。对于非复杂推理任务,官方强烈推荐用户尝试新版本V3模型,享受更加流畅的对话速度和全面提升的使用效果。
在新版V3模型中,最引人注目的变化在于其推理任务表现的大幅提升。通过借鉴DeepSeek-R1模型训练中的强化学习技术,新版V3模型在数学、代码类评测集上的表现甚至超过了GPT-4.5的得分,这无疑是对其技术实力的一次有力证明。
除此之外,新版V3模型在百科知识、数学以及代码任务上的表现均有所提升。特别是在HTML等前端代码任务上,新版模型生成的代码不仅可用性更高,而且视觉效果也更加美观,富有设计感。一张动图展示了模型生成的p5.js程序,该程序能够演示多个小球在指定空间范围内的运动,并包含可调整重力、摩擦力等参数的滑动按钮,整体以赛博朋克风格的HTML呈现,令人眼前一亮。
在中文写作方面,新版V3模型同样进行了优化。基于R1模型的写作水平,新版V3模型进一步提升了内容质量,尤其是在中长篇文本创作上,表现尤为突出。几张展示新版模型中文写作能力的图片,更是让人对其进步刮目相看。
新版V3模型在中文搜索能力上也进行了优化。在联网搜索场景下,对于报告生成类指令,新版模型能够输出内容更为详实准确、排版更加清晰美观的结果,进一步提升了用户的使用体验。
新版V3模型在工具调用、角色扮演、问答闲聊等方面也均有所提升,为用户带来了更加全面、丰富的使用体验。在模型开源方面,DeepSeek-V3-0324与之前的DeepSeek-V3使用相同的base模型,仅对后训练方法进行了改进。私有化部署时,用户只需更新checkpoint和tokenizer_config.json(tool calls相关变动)即可。模型参数约660B,开源版本上下文长度为128K(网页端、App和API提供64K上下文)。用户可在Huggingface平台上下载V3-0324模型权重。
此次DeepSeek-V3模型的更新,无疑是一次全面的技术升级,为用户带来了更加优质的使用体验。我们期待在未来,DeepSeek能够继续发挥其技术优势,为用户带来更多惊喜。