近日,科技界巨头马斯克在其个人社交平台X上预告了一项重大突破:自家公司xAI研发的Grok 3人工智能模型即将面世。他激动地宣称,这将是“地球上最聪明的AI”。
两天后,北京时间2025年2月18日中午,马斯克携手xAI的精英工程师和研究团队,通过直播向全球观众揭开了Grok 3的神秘面纱。这场发布会精彩纷呈,不仅详细介绍了Grok 3在训练上投入的巨大资源,还展示了其强大的计算能力和一系列创新应用。
马斯克在发布会上自豪地表示,Grok 3是在Colossus超级计算机上训练完成的,这台超级计算机在短短八个月内建成,搭载了惊人的10万颗英伟达H100 GPU,提供了超过2亿GPU小时的计算资源,是Grok 2的10倍之多。这一显著的算力提升,使得Grok 3能够更高效地处理海量数据,大大缩短了训练时间。
xAI团队还现场展示了Grok 3与ChatGPT的数据对比图,虽然Grok起步较晚,但在MMLU得分上却以惊人的速度追上了ChatGPT。在LMSYS(大模型竞技场)中,Grok 3的排名同样遥遥领先,其性能在多个方面都超越了Gemini、DeepSeek和ChatGPT等竞争对手。
发布会现场,xAI团队还演示了Grok 3的一些实际应用。他们要求Grok 3现场生成一段关于太空发射的3D动画代码,结果在两分钟的思考后,Grok 3成功生成了可直接运行的Python代码,并展示了精美的3D动画效果。团队还要求Grok 3制作一款类似于俄罗斯方块和宝石迷阵的游戏,Grok 3同样在短时间内给出了令人满意的答案。
更令人瞩目的是,xAI团队还推出了一款基于Grok 3的全新搜索引擎——DeepSearch。这款搜索引擎不仅能够搜索网页并查找现有资料,还能“推测用户的真实意图”并进行思考。通过交叉对比多个信息源,它能够确保返回最准确的答案,为用户带来前所未有的搜索体验。
直播结束后,网友们纷纷发表了自己的看法。AI领域专家卡帕西分享了他的“先行版”使用体验,他认为Grok 3的“思考”功能非常先进,能够出色地解决复杂问题,如创建棋盘游戏网页等。同时,Grok 3还具备类似“深度研究”的搜索功能,能够提供高质量的研究问题答案。然而,在某些情况下,它也会产生幻觉,如提供错误的URL或不准确的事实。
Imarena.ai官方在经过测试后发文称,Grok 3是首个突破1400分的模型,在所有类别中排名第一,这是一个前所未有的里程碑。这一消息无疑进一步提升了Grok 3的声誉和关注度。
然而,尽管Grok 3受到了广泛赞誉,但也有一些网友在测试后认为它在编程方面并不是很擅长。对于这一争议,马斯克和xAI团队并未直接回应。他们表示,Grok 3第一批获得访问权限的人将从X上的Premium+订阅者开始,而普通用户何时能用上,目前尚不清楚。