ITBear旗下自媒体矩阵:

马斯克的Grok 3智商“翻车”?连9.11和9.9大小都分不清

   时间:2025-02-19 16:34:30 来源:ITBEAR编辑:快讯团队 发表评论无障碍通道

近期,科技界迎来了一场备受瞩目的发布会,由埃隆·马斯克及其xAI团队带来的Grok 3正式亮相。此前,马斯克通过一系列预热活动,已经将公众对Grok 3的期待值推向了新的高峰。然而,尽管马斯克对Grok 3寄予厚望,并赋予了其极高的评价,但其实际表现却并未如预期般惊艳。

在发布会上,马斯克自信满满地宣布,Grok 3在数学、科学与编程等领域的基准测试中,已经超越了所有主流模型。他甚至表示,计划将Grok 3应用于SpaceX的火星任务计算,并预测在未来三年内,Grok 3有望实现诺贝尔奖级别的突破。这样的豪言壮语,无疑让人们对Grok 3充满了期待。

然而,现实却给马斯克和Grok 3泼了一盆冷水。在发布会后,一些媒体对Grok 3进行了测试,结果却令人大跌眼镜。当被问及“9.11与9.9哪个大”这一简单问题时,号称目前最聪明的Grok 3竟然无法给出正确答案,这一表现引发了网友们的广泛调侃和嘲笑。

不仅如此,在xAI发布会直播中,当Grok 3被用来分析游戏《流放之路 2》的职业与升华效果时,也给出了大量错误答案。更为尴尬的是,马斯克在直播中并未发现这些明显的错误。这一系列问题,让人们对Grok 3的实际能力产生了严重质疑。

尽管在官方PPT中,Grok 3在大模型竞技场Chatbot Arena中看似表现优异,但实际上,其与DeepSeek R1和GPT4.0的差距仅为1%到2%。这一数据表明,随着模型规模的不断扩大,性能提升的边际效应已经越来越明显。

在发布会上,马斯克透露,Grok 3使用了超过20万张H100芯片,总训练小时数达到两亿小时。然而,与之相比,DeepSeek V3仅使用了2000张H800芯片训练两个月,就取得了与Grok 3相差无几的性能。这一对比,进一步凸显了Grok 3在性能提升上的困境。

面对外界的质疑和批评,马斯克在社交媒体上表示,当前的Grok 3仅是测试版,完整版将在未来几个月内推出。他邀请用户反馈使用问题,并表示将针对这些问题进行改进和优化。然而,对于已经对Grok 3失去信心的用户来说,这一表态是否能够挽回他们的信任,仍然是一个未知数。

举报 0 收藏 0 打赏 0评论 0
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  RSS订阅  |  开放转载  |  滚动资讯  |  争议稿件处理  |  English Version