通义灵码团队近期正式推出了Qwen3,并慷慨地开源了八款“混合推理模型”,这一举动标志着编程智能体技术迈入了一个崭新的发展阶段。此次开源涵盖了两种基于MoE架构的模型——Qwen3-235B-A22B与Qwen3-30B-A3B,前者拥有超过2350亿的总参数和220多亿的激活参数,后者则具备300亿总参数和30亿激活参数。还有六个Dense模型系列,从Qwen3-32B到Qwen3-0.6B,满足了不同场景下的需求。
Qwen3的明星产品Qwen3-235B-A22B在多项基准测试中大放异彩,包括代码理解、数学运算及通用能力测试,与DeepSeek-R1、o1、o3-mini、Grok-3及Gemini-2.5-Pro等业界顶尖模型相比,Qwen3-235B-A22B展现出了卓越的竞争力。这一卓越表现不仅彰显了Qwen3的技术优势,更为其在各种实际应用中的广泛部署铺平了道路。
通义灵码团队还宣布Qwen3模型现已无缝集成到VSCode、Visual Studio及JetBrains系列IDE的灵码插件中。这意味着开发者可以在他们熟悉的开发环境中直接使用Qwen3,从而大幅提升编程效率和代码质量。
Qwen3模型设计独特,支持两种截然不同的思考模式:思考模式与非思考模式。在思考模式下,模型会进行详尽的推理步骤,最终给出深思熟虑的答案,非常适合解决复杂问题。而在非思考模式下,模型则提供快速、即时的响应,适用于处理简单任务。这种灵活性使得用户可以根据具体需求灵活调整模型的“思考”深度,实现高效且稳定的“思考预算”管理。
多语言能力也是Qwen3的一大亮点,它支持多达119种语言和方言,为国际用户带来了前所未有的便利。这一广泛的语言覆盖使得全球开发者都能享受到Qwen3的强大功能。
在Agent能力方面,Qwen3同样表现出色,在BFCL评测中取得了70.8的高分,超越了Gemini2.5-Pro、OpenAI-o1等领先模型。这一成就意味着使用Qwen3作为Agent时,调用工具的门槛将大大降低。Qwen3原生支持MCP协议,并具备强大的工具调用能力。结合Qwen-Agent框架提供的工具调用模板和解析器,开发者可以更加轻松地进行编码工作,极大地降低了开发复杂度。
通义灵码即将推出的编程智能体将进一步增强开发者的工具配置能力,支持自定义MCP工具,并集成魔搭MCP广场。开发者将能够一键下载MCP服务,这一创新举措无疑将推动编程智能体技术的进一步发展,为开发者提供更加全面和强大的支持。
感兴趣的开发者可以通过以下链接下载Qwen3模型:https://lingma.aliyun.com/download。