在科技界的瞩目下,埃隆·马斯克通过其社交平台X,预告了一款名为Grok 3的人工智能模型即将面世,并自信地宣称这将是“地球上最聪明的AI”。
两天后的北京时间2025年2月18日中午,马斯克携手xAI团队的工程师与研究人员,通过一场直播活动,正式揭开了Grok 3的神秘面纱。这场发布会细致入微地展示了Grok 3的多项突破性进展。
发布会首先聚焦于Grok 3在训练过程中的巨大投入。据马斯克透露,Grok 3是在名为Colossus的超级计算机上完成训练的,这台仅用八个月时间便迅速搭建起的超级计算机,配备了惊人的10万颗英伟达H100 GPU,提供了超过2亿GPU小时的计算资源,这一数量是Grok 2的十倍之多。
发布会现场,xAI团队展示了Grok 3与ChatGPT在数据上的对比,以及Grok 3在LMSYS(大模型竞技场)中的卓越排名,进一步证明了其强大的实力。从数学、科学到编程,Grok 3在各种基准测试中均超越了主流模型,包括GPT-4、Claude 3.5 Sonnet等。
更引人注目的是,xAI团队现场演示了Grok 3的实际应用能力。在接到生成一段关于太空发射的3D动画代码的指令后,Grok 3仅用了大约两分钟的时间便生成了可运行的Python代码,并成功展示了3D动画效果。它还完成了一款类似俄罗斯方块和宝石迷阵的游戏设计任务。
发布会上,xAI团队还推出了一款基于Grok 3的全新搜索引擎——DeepSearch。这款搜索引擎不仅能够搜索网页和查找现有资料,还能“推测用户的真实意图”并进行深度思考,通过交叉对比多个信息源,确保返回最准确的答案。
直播结束后,网友们对Grok 3展开了热烈讨论。AI领域专家卡帕西分享了其“先行版”使用体验,指出Grok 3在解决复杂问题、创建棋盘游戏网页等方面表现出色,甚至尝试解决黎曼假设等难题。同时,Grok 3还具备强大的搜索功能,能够提供高质量的研究问题答案。然而,在某些情况下,它也可能产生错误的信息。
Imarena.ai官方在经过测试后发文称,Grok-3在所有类别中排名第一,突破了1400分的里程碑,这是一个前所未有的成就。
网友们对Grok 3的评价褒贬不一。有人认为,Grok 3可能是现实世界中物理层面处理得最好的基础大语言模型;而也有人认为,Grok 3在编程方面并不擅长。首批获得Grok 3访问权限的将是X平台上的Premium+订阅者,普通用户何时能用上尚不清楚。