3月26日,中国AI又给全球开源社区带来了新惊喜——阿里通义千问与DeepSeek,均于昨日低调开源了两款新模型:阿里发布了更适合本地部署的高性能「多模态模型」Qwen2.5-VL-32B,DeepSeek则将此前热门的「基座模型」V3更新到0324版本,并官宣在魔搭社区上架开源。截至目前,魔搭社区模型总数已超4万个,已成为中国最大的AI开源社区。

千问Qwen-VL是全球AI开源社区最受欢迎的多模态模型之一,此前,通义千问Qwen2.5-VL已开源3B、7B及72B等3个尺寸,昨日又推出更适合本地部署的32B版本。Qwen2.5-VL-32B模型在MMMU、MathVista、 MM-MT-Bench 等基准测试中的性能表现突出,超越了更大规模的 Qwen2-VL-72B 和 GPT-4o-0513,并且优于近期火热的 Mistral-Small-3.1-24B 、Gemma-3-27B-IT等模型。在开发者关注的知名Hacker News网站上,Qwen2.5-VL-32B的热度爆表,是当天评论最多的新闻。


DeepSeek-V3是全球最受关注的基座大模型之一,也于昨夜官宣完成小版本升级。据DeepSeek透露,新版 V3-0324 模型借鉴 R1 模型训练过程中所使用的强化学习技术,大幅提高了在推理类任务上的表现水平,在数学、代码类相关评测集上取得了超过 GPT-4.5 的得分成绩,并在前端开发、中文写作、中文搜索等能力上均有提升。V3-0324 模型在HuggingFace开源后不久,即斩获趋势榜榜首。同时,在昨日官方推文中,DeepSeek首次官宣在魔搭社区开源,更好服务于中国开发者和企业。

据了解,阿里云联合CCF开源发展委员会共同牵头组建的魔搭社区(Model Scope),已发展成为中国最大的AI开源社区。秉承“模型即服务”(MaaS,Model as a Service)理念,魔搭为AI开发者提供模型体验、下载、调优、训练、推理、部署等一站式服务,“找大模型上魔搭”成为开发者心照不宣的默契。截至目前,阿里通义千问、DeepSeek、阶跃星辰、MiniMax、月之暗面、百川智能、零一万物、智谱AI等知名大模型公司均官方在魔搭开源最新模型,魔搭社区模型总量超过 4万个,涵盖LLM、对话、语音、文生图、图生视频、AI作曲等多个领域,魔搭已经服务超过1000万开发者。
(完)