ITBear旗下自媒体矩阵:

阿里Qwen3系列模型或将今日面世,涵盖多尺寸全模态

   时间:2025-04-28 21:14:15 来源:ITBEAR编辑:快讯团队 发表评论无障碍通道

近日,阿里巴巴旗下AI领域的重大动态引发了广泛关注。据可靠消息透露,阿里通义千问开源项目的领军人物林俊旸,在某一平台上发布了一条引人遐想的消息,暗示Qwen3系列模型或将于近期面世。

值得注意的是,Qwen3系列模型此前曾在阿里巴巴的AI模型开源社区ModelScope(魔搭)上短暂亮相,随后又悄然下线。这一系列包括了Qwen3-4B-Base、Qwen3-1.7B、Qwen3-0.6B以及Qwen3-30B-A3B-Base四款模型,全部遵循Apache License 2.0开源协议。尽管官方尚未发布正式公告,但通过观察命名规则与前代技术的逻辑,业界对其技术路径和定位方向已有初步推测。

在即将发布的模型中,Qwen3-4B、Qwen3-1.7B和Qwen3-0.6B以参数规模直接命名,分别对应40亿、17亿和6亿参数。这种无后缀的命名方式,或许意味着它们采用的是单架构稠密模型,并未采用混合专家(MoE)设计,更侧重于轻量化应用场景。而Qwen3-30B-A3B-Base则是一款MoE架构的基础模型,其总参数达到300亿(30B),但在处理任务时仅动态调用30亿(3B)参数。

据AIbase的报道,Qwen3系列模型在功能上也颇具亮点,其支持高达256K的上下文长度,能够涵盖推理与非推理任务,这无疑将极大地提升其在各种应用场景下的表现。

回顾过去,自2023年8月以来,阿里云在开源AI模型方面取得了显著进展,相继推出了Qwen、Qwen1.5、Qwen2、Qwen2.5等四代模型,覆盖了从0.5B到110B的全尺寸范围,以及大语言、多模态、数学和代码等全模态领域。这一系列动作不仅展示了阿里云在AI领域的深厚积累,也为其在全球范围内的竞争力注入了新的活力。

举报 0 收藏 0 打赏 0评论 0
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  RSS订阅  |  开放转载  |  滚动资讯  |  争议稿件处理  |  English Version