近期,科技界迎来了一波人工智能领域的重大进展。特斯拉创始人埃隆·马斯克宣布,其旗下的人工智能实验室xAI即将推出Grok 3.5版本,这一版本的人工智能据称能够准确解答关于火箭发动机和电化学技术的专业问题,并且能够从第一原理出发进行推理,生成互联网上未曾存在的答案。
xAI实验室将Grok 3.5定位为全球首个能从第一性原理出发进行推理,并生成独特答案的人工智能系统。这一消息发布后,引起了业界的广泛关注。此前,xAI已经在今年2月推出了Grok 3版本,并在发布后的两天内,将该应用免费向公众开放。这一举措迅速提升了Grok 3的知名度,使其超越了ChatGPT,登上了苹果应用商店免费应用下载排行榜的首位。马斯克甚至曾称赞Grok 3为“地球上最聪明的人工智能”。
然而,就在马斯克宣布即将推出Grok 3.5的前夕,中国科技巨头阿里巴巴也发布了其新一代通义千问模型——Qwen3。这一发布时机不禁让人将两者联系起来。Qwen3在参数量上仅为DeepSeek-R1的三分之一,成本大幅降低,但性能却全面超越了R1、OpenAI-o1等全球顶尖模型,成功登顶全球最强开源模型的宝座。
Qwen3作为国内首个“混合推理模型”,集成了“快思考”与“慢思考”两种模式,能够针对简单需求以低算力迅速给出答案,而对于复杂问题,则能够进行多步骤的“深度思考”。这一设计大大节省了算力消耗,提高了模型的效率。
在多个权威评测中,Qwen3展现出了其卓越的性能。在奥数水平的AIME25测评中,Qwen3获得了81.5分的高分,刷新了开源模型的纪录。在考察代码能力的LiveCodeBench评测中,Qwen3突破了70分大关,表现甚至优于Grok3。在评估模型人类偏好对齐的ArenaHard测评中,Qwen3以95.6分的成绩超越了OpenAI-o1及DeepSeek-R1。
Qwen3在性能大幅提升的同时,部署成本也大幅下降。仅需4张H20显卡即可部署Qwen3的满血版,显存占用仅为性能相近模型的三分之一。这一优势使得Qwen3在实际应用中具有更强的竞争力。
随着Grok 3.5和Qwen3的相继发布,人工智能领域的竞争愈发激烈。这些创新不仅推动了技术的进步,也为未来的应用提供了更多的可能性。