ITBear旗下自媒体矩阵:

Grok3真的“天下最聪明”?大模型边际效应引发热议!

   时间:2025-02-19 09:59:43 来源:ITBEAR编辑:快讯团队 发表评论无障碍通道

北京时间2月18日,科技界迎来了一场万众瞩目的直播发布——马斯克携手xAI团队正式揭晓了Grok系列的最新力作,Grok3。在这场发布会之前,马斯克通过多渠道预热,将全球对Grok3的期待推向了高潮。他甚至在直播中提及Grok3将应用于SpaceX的火星任务,并预言其将在三年内带来诺贝尔奖级别的突破。

然而,发布会后的实际测试却给这份狂热泼了一盆冷水。众多测试者发现,尽管Grok3在数学、科学与编程基准测试中表现不俗,但在面对一些基础常识问题时却频频“翻车”。例如,当被问及“9.11与9.9哪个大”这一简单数学问题时,Grok3竟未能给出正确答案。这一尴尬局面迅速在网络上发酵,引发了广泛讨论。

不仅如此,在发布会直播现场,马斯克演示Grok3分析游戏《流放之路2》职业与升华效果时,也暴露出了大量错误答案。这一失误不仅成为了网友调侃马斯克游戏水平的笑料,也让人们对Grok3的实际应用能力产生了严重质疑。

据透露,为了训练Grok3,马斯克不惜投入巨额资源,使用了超过20万张H100 GPU,总训练时长达到两亿小时。这一数字虽然彰显了xAI团队的雄心壮志,但也引发了业界对于“算力堆砌”是否真的是大模型训练未来的深刻反思。有网友对比指出,Grok3的训练算力消耗是DeepSeek V3的263倍,但两者在模型竞技场榜单上的得分差距却微不足道。

事实上,早在Grok2时代,xAI团队就因在榜单上“刷分”而备受争议。此次Grok3虽然成功登顶,但“高分低能”的质疑声依然不绝于耳。许多测试者表示,在实际应用中,Grok3的表现并不比DeepSeek R1或GPT4.0等竞品更为出色。

面对种种质疑,马斯克在社交媒体上积极回应,表示当前版本的Grok3仍处于测试阶段,完整版将在未来几个月内推出。他甚至亲自化身产品经理,鼓励用户反馈使用过程中遇到的问题。然而,Grok3的“翻车”事件已经给整个行业敲响了警钟——在追求模型规模和算力的同时,如何确保模型的实用性和智能性成为了亟待解决的问题。

值得注意的是,OpenAI前首席科学家Ilya Sutskever曾预言“预训练时代即将结束”。他指出,随着互联网中人类生成内容的有限性日益凸显,模型难以再通过简单获取数据来提升性能。未来的AI系统将需要具备真正的自主性和类似人脑的推理能力。这一观点为行业指明了方向,也提醒人们在“力大飞砖”之外寻找大模型训练的新出路。

举报 0 收藏 0 打赏 0评论 0
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  RSS订阅  |  开放转载  |  滚动资讯  |  争议稿件处理  |  English Version