滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

谷歌Gemini 2.5 Pro强势登顶，编程能力惊艳，"人类最后考试"超OpenAI

时间：2025-03-26 10:56:28 来源：ITBEAR编辑：快讯团队 发表评论无障碍通道

近期，科技界迎来了一则重磅消息，谷歌正式揭晓了其Gemini思考模型家族的最新力作——Gemini 2.5 Pro实验版。这款模型一经面世，便以卓越表现震惊业界，在多项基准测试中力压群雄，包括OpenAI的o3-mini、Claude 3.7 Sonnet、Grok-3及DeepSeek-R1，以1443分的高分荣登大模型竞技场榜首，领先第二名多达39分。

值得注意的是，尽管Gemini 2.5 Pro在多项测试中展现出强大实力，但谷歌并未提供它与OpenAI更早版本模型，如o1、o1-Pro及o3的直接对比数据。在智能体编程评估基准SWE-bench verified上，它的表现略逊于Claude 3.7 Sonnet。

然而，Gemini 2.5 Pro的辉煌成就远不止于此。它不仅在大模型竞技场这一衡量人类偏好的平台上独占鳌头，还在编程、数学及科学基准测试中占据领先地位，尤其是在被誉为“人类最后考试”的超高难度测试中，相较于OpenAI o3-mini，其得分提升了近5%，提升幅度高达34%。更令人兴奋的是，该模型现已支持100万tokens的上下文窗口，并计划不久的将来扩展至200万tokens。

目前，开发者们已能在谷歌AI Studio平台上体验到Gemini 2.5 Pro的魅力，而普通用户则需拥有Gemini Advanced订阅账号方能一探究竟。据悉，谷歌将在未来几周内公布该模型的定价策略，届时用户将有机会利用这一高性能模型进行大规模商用。

为了直观展示Gemini 2.5 Pro的强大功能，谷歌DeepMind在其YouTube频道上发布了一系列演示视频，生动呈现了其编程能力与其他领域的深度融合。例如，该模型能够根据用户指令，在p5.js中探索曼德博集合，生成边缘清晰、色彩过渡平滑的可视化效果。它还能根据提示词创建互动式图表，将人均GDP与健康数据巧妙结合，揭示两者之间的微妙关系。

在编程领域，Gemini 2.5 Pro同样展现出了非凡实力。无论是创建美观的Web应用，还是在智能体编程、代码转换与编辑任务中，它都表现出色。尽管在SWE-bench verified基准测试中，其得分低于Claude 3.7 Sonnet，但采用定制智能体配置仍取得了63.8%的亮眼成绩。

作为Gemini模型家族的一员，Gemini 2.5 Pro继承了原生多模态处理能力和超长上下文窗口的优势。目前，它能够处理高达100万tokens的上下文信息，并即将升级至200万tokens，这意味着它将能够解析更为复杂的数据集，处理来自文本、音频、图像、视频乃至完整代码库等多元信息源的挑战。

Gemini 2.5 Pro的发布与DeepSeek-V3新版本的问世几乎同时发生，两者都不约而同地提升了在编程、审美、数学等方面的能力，并将其作为核心亮点进行展示。这一趋势表明，AI编程能力的提升已成为大模型厂商竞相追逐的新前线，不仅将为用户带来更为直观的使用体验变化，更有望在生产场景中实现显著的效益提升。

举报 0 收藏 0 打赏 0评论 0

更多>同类资讯

它石智航天使轮融资8.6亿！华为前CTO携手天才少年打造具身智能新篇章

它石智航正式成立于今年2月，是行业内独有的同时具备具身智能大模型能力、本体研发能力和软硬一体产品量产能力的公司。团队方面，它石智航CEO陈亦伦是国内具身智能、自动驾驶领域技术及产业的领军人，曾任清华大学智…

03-26

微盟集团财报：首次披露AI产品商业化进展，国产SaaS距离“GPT”时刻还有多远？

近日港股SaaS集体发布财报，而微盟的一组数据比较亮眼——微盟旗下大模型应用产品WAI SaaS，为新客户交付期使用量提升217.7%，使用AI的中小商家续费率达到了75%。这很可能是中国SaaS企业为数不多的AI商业化应用的成果。2025年开年以来，国内AI大模型颠覆性突破持续爆发

03-26

它石智航天使轮融资1.2亿，陈亦伦李震宇携“豪华梦之队”领跑具身智能

03-26

三星9100 PRO PCIe 5.0固态硬盘评测：存储性能新标杆，时代新宠儿

03-26

优必选天津新设科技公司，2000万注册资本布局多元AI领域

03-26

腾讯元宝大升级！混元T1+DeepSeek V3，思考写作新体验

03-26

光子芯片新突破！0.3平方毫米内实现800GB/s超高速传输

03-26

快手可灵AI营收破亿，程一笑：目标全球视频生成AI应用营收之首

03-26

招行2024年报解析：科技投入不减，财富管理下行，消费贷猛增

体现在业绩中，招行延续去年营收下滑的态势，去年实现营业收入3374.88亿元，同比下降0.48%；但扭转了此前三个季度利润连续下滑的局面，全年实现净利润1483.91亿元，同比增长1.22%。另一项是代…

03-26

腾讯元宝双模型齐发：混元T1飞速升级，DeepSeek V3代码创作更强大

今日凌晨，腾讯元宝宣布两大模型同时上新：深度思考模型「混元T1」正式版和DeepSeek V3-0324 最新版。相比此前的T1Preview，T1 正式版更「快」了：能秒回、吐字速度更快。同时，效果也更「…

03-26

AI大模型赋能APP，DeepSeek月活1.8亿领跑AIGC赛道！

03-26

谷歌新推Gemini 2.5 AI模型，能否引领推理能力新高度？

03-26

腾讯元宝两大AI模型重磅更新：混元T1与DeepSeek V3齐上线

03-26

DeepSeek V3小版本升级，性能飞跃，数学推理与前端代码生成大提升！

03-26

谷歌新一代AI模型Gemini 2.5：多模态推理能力领跑业界

其旗舰版本Gemini 2.5 Pro Experimental在多项基准测试中超越OpenAI、Anthropic等竞争对手，尤其在代码生成和数学推理领域表现亮眼，标志着AI技术在复杂任务处理上的重大突破…

03-26

点击查看更多 +

全站最新

中国中铁高层调整尘埃落定，陈文健接任董事长一职

恒大地产等房企被执行近9亿巨款，债务风波再起？

岚图梦想家：以智驾安全五星标准，重塑MPV安全新高度！

招银国际携手中邮保险沪上共设私募基金，斥资27.6亿布局新领域

网红大祥哥企业现状如何？疑陷经营异常风波

阿斯顿·马丁Vanquish Volante亮相：V12敞篷跑车，优雅与性能并存

热门内容

本栏最新

它石智航天使轮融资8.6亿！华为前CTO携手天才少年打造具身智能新篇章

它石智航天使轮融资1.2亿，陈亦伦李震宇携“豪华梦之队”领跑具身智能

三星9100 PRO PCIe 5.0固态硬盘评测：存储性能新标杆，时代新宠儿

优必选天津新设科技公司，2000万注册资本布局多元AI领域

腾讯元宝大升级！混元T1+DeepSeek V3，思考写作新体验

光子芯片新突破！0.3平方毫米内实现800GB/s超高速传输

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.