滚动资讯

当前位置：首页 > 资讯 > 业界动态 > 正文内容

GPT-4.1编程能力飞跃，谷歌Gemini系列仍领跑AI性能榜？

时间：2025-04-16 09:11:02 来源：ITBEAR编辑：快讯团队 发表评论无障碍通道

近期，科技领域迎来了一波新的模型发布高潮，其中OpenAI推出的GPT-4.1系列模型尤为引人注目。据bleepingcomputer报道，这一最新版本相较于其前身GPT-4o，在性能上实现了显著飞跃。

OpenAI于4月15日正式揭晓了GPT-4.1、GPT-4.1 mini及GPT-4.1 nano三款新模型。从官方公布的跑分数据来看，这些新模型在编程能力上有了质的飞跃，远远超越了GPT-4o及其小型版本GPT-4o mini。以SWE-bench Verified跑分为例，GPT-4o仅获得了21.4%的分数，而GPT-4.1则一举跃升至54.6%，展现出了强大的编程实力。

然而，尽管GPT-4.1系列模型在性能上取得了显著提升，但在与谷歌Gemini系列的对比中，却并未能占据上风。根据Stagehand发布的基准数据，Gemini 2.0 Flash在错误率和精确匹配率上均表现优异，错误率仅为6.67%，精确匹配率高达90%，且价格更为亲民，速度更快。相比之下，GPT-4.1的错误率则高达16.67%，成本更是Gemini 2.0 Flash的十倍以上。

来自哈佛大学的RNA科学家Pierre Bongrand也提供了相关数据，进一步印证了GPT-4.1在性价比方面的不足。他指出，相较于Gemini 2.0 Flash、Gemini 2.5 Pro及DeepSeek等竞品，GPT-4.1的性价比并不具备优势。

在编码专项测试中，GPT-4.1的表现同样未能让人眼前一亮。Aider Polyglot的测试结果显示，GPT-4.1的编码得分仅为52%，而谷歌的Gemini 2.5则以73%的得分遥遥领先，进一步凸显了GPT-4.1在编码能力上的不足。

值得注意的是，尽管GPT-4.1被归类为非推理模型，但其在编码能力方面依然处于行业领先地位。这一成绩无疑为OpenAI的AI研发实力提供了有力证明，同时也为未来的AI模型发展提供了更多可能性。

然而，在与谷歌Gemini系列的对比中，GPT-4.1也暴露出了自身在性价比和错误率方面的不足。这提醒我们，在AI技术的快速发展中，仍需不断追求性能与成本的平衡，以更好地满足实际应用需求。

举报 0 收藏 0 打赏 0评论 0

更多>同类资讯

技嘉RTX 5060 OC LP 8G半高显卡发布，专为SFF机箱打造，小巧又强大！

04-16

Outlook打字致CPU狂飙，微软急发警告！

04-16

敦煌网在美爆火，App Store免费榜直逼ChatGPT，跃居第二！

中国跨境电商应用敦煌网DHgate这两天在美国火了。在美区App Store免费应用榜单中，敦煌网已经冲到第2，仅次于ChatGPT。而此前敦煌网在美区App store免费榜上长期处于300名左右。4月1…

04-16

易鑫受邀参加“2025世界互联网大会亚太峰会”，AI创新能力获业界认可

4月14日至15日，由世界互联网大会主办、香港特别行政区政府承办的“世界互联网大会亚太峰会”在香港举行。AI驱动的金融科技平台易鑫(02858.HK)首度亮相该峰会，宣布将于年内推出汽车金融行业首个Agentic大模型。易鑫首席AI科学家、高级副总裁张磊演讲现场此次峰会全面聚

04-16

OpenAI纳入Context.ai，强化AI模型评估能力

04-16

我国地月空间探索迎新突破：成功构建国际首个三星星座！

04-16

三星新专利：Galaxy Ring智能戒指如何重塑AR/VR交互体验？

04-16

杨维廉逝世：他让“嫦娥一号”多飞了一年

04-16

Windows系统盘现“virus”空文件夹，竟是Trend Micro软件作祟？

04-16

ChatGPT上新图库功能，AI生成图片管理更便捷！

04-16

潭洲隧道：国内最大内河沉管隧道首节沉管安装启动！

04-16

中国地月空间探索新突破：三星星座成功构建！

04-16

C919翱翔蓝天！南航国产大飞机正式加盟武广快线

04-16

可触碰3D全息图来袭：空中抓取移动不再是梦

04-16

儿童希望之光！华中大附属医院研发出全球最小磁悬浮人工心脏

04-16

点击查看更多 +

全站最新

混动王者来袭！一箱油续航超千公里，这些车你心动了吗？

四款热门小排量发动机比拼，谁才是你的心头好？答案揭晓！

Fedora Linux 42稳定版来袭！搭载Linux 6.14内核与GNOME 48桌面环境

英特尔推动笔记本模块化革新：维修升级将迎大变革？

沃尔沃新XC90上市，起售价47.9万起，全面升级能否再掀热潮？

蔚来萤火虫挑战Smart，小众市场能否成为盈利新出路？

热门内容

本栏最新

易鑫受邀参加“2025世界互联网大会亚太峰会”，AI创新能力获业界认可

我国地月空间探索迎新突破：成功构建国际首个三星星座！

三星新专利：Galaxy Ring智能戒指如何重塑AR/VR交互体验？

杨维廉逝世：他让“嫦娥一号”多飞了一年

ChatGPT上新图库功能，AI生成图片管理更便捷！

潭洲隧道：国内最大内河沉管隧道首节沉管安装启动！

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.