滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

OpenAI新模型o3与o4-mini：大模型与Agent融合的新里程碑？

时间：2025-04-23 12:39:13 来源：ITBEAR编辑：快讯团队 发表评论无障碍通道

奥特曼公司在科技界的又一次重大动作引发了广泛关注。近日，该公司宣布推出两款全新的o系列模型——满血版o3和o4-mini，这两款模型不仅性能强劲，而且能够无缝集成ChatGPT中的多种工具，涵盖图像生成、图像分析、文件解释、网络搜索以及Python编程等多个领域。

据奥特曼公司介绍，这两款新模型相较于前代产品，在性能上有了显著提升，同时价格更加亲民。消息一经发布，立即引发了科技爱好者的热烈讨论和测试。

网友们纷纷晒出了对新模型的测试结果，其中“小球测试”的结果尤为引人注目。一位网友表示：“这是我迄今为止看到的最好的测试结果，o3和o4-mini的表现确实令人惊叹。”在HLM基准测试中，这两款新模型也迅速攀升至榜单前三，其强大的性能让业内人士和网友们大呼震惊。

从官方数据来看，o3在多个基准测试中刷新了纪录，包括Codeforces、SWE-bench和MMMU等。在应对复杂现实任务时，o3相比OpenAI o1减少了20%的重大错误，尤其在编程、商业咨询和创意构思方面表现出色。而o4-mini虽然体积小巧，但专为快速、高效的推理任务而设计，支持更高的使用频率。在数学、编程和视觉任务上，o4-mini同样表现出色，在2025年AIME数学竞赛中，借助Python解释器的帮助，取得了接近满分的优异成绩。

o3和o4-mini首次实现了将图像直接融入思维链的能力。它们不仅能够“看见”图像，更能“通过图像思考”，这一创新带来了视觉与文本推理的全新融合方式，显著提升了模型在多模态任务中的表现。OpenAI图像推理研究员Jiahui Yu表示：“自o系列推出以来，‘图像思考’始终是我们感知领域的核心战略之一。如今，随着o3和o4-mini的发布，这一战略终于以更为成熟和完整的形式落地。”

这两款新模型能够自由调用ChatGPT中的各种工具，这一能力让模型从“聪明大脑”进化为“灵巧双手”。网友们纷纷尝试利用这一新功能，发现模型能够轻松完成跨工具的任务，带来了前所未有的便捷体验。OpenAI首席研究官Mark Chen表示：“一旦推理模型学会了端到端地使用工具，它们就会变得更加强大。最新的o系列模型正是我们向未来迈出的重要一步。”

除了新模型的发布，奥特曼公司还开源了一款本地代码智能体——Codex CLI。这款轻量级的编码助手能够直接在用户的终端命令行中运行，充分发挥o3、o4-mini等模型的推理能力，紧密连接本地开发环境。未来，Codex CLI还将支持GPT 4.1等其他模型，为开发者提供更加便捷、高效的编码体验。Codex CLI甚至支持通过截图或手绘草图进行多模态编程，这一创新功能刷新了代码交互与内容理解的边界。

举报 0 收藏 0 打赏 0评论 0

更多>同类资讯

强化学习：AI Agent的智能引擎，还是发展路上的绊脚石？

04-23

Vidu Q1问鼎VBench榜首，视频大模型新王者诞生！

04-23

米哈游璃月科技公司大幅增资，资本金跃升至4亿，涨幅高达150%

04-23

罗盘Compass Copilot：企业大模型应用搭建的新引擎

04-23

AI赋能跨境电商，微盟助力中国商家海外弯道超车

04-23

天津国际航运展6月启幕，“浚澜”环保绞吸船引领绿色智慧航运新风尚

04-23

小米5月下旬新品爆发：手机平板眼镜手表，你期待哪一款？

04-23

德施曼2025新品盛宴：AI智能管家Miya引领智能锁新纪元！

04-23

医渡科技获券商力荐，YiduCore与DeepSeek双轮驱动医疗AI新未来

04-23

OpenAI表示若谷歌剥离Chrome，愿参与收购竞标

媒体报道，OpenAI旗下ChatGPT负责人周二表示，如果联邦法院裁定谷歌必须剥离Chrome浏览器，OpenAI愿意收购这一浏览器产品。 Alphabet旗下谷歌去年被联邦法官裁定垄断搜索市场，美国司法部…

04-23

苹果Siri团队重组，新任负责人能否引领AI新篇章？

04-23

三七互娱年度分红22亿，游戏巨头为何热衷回馈股东？

04-23

vivo X200系列：以蓝科技为矛，再攀移动影像高峰！

04-23

智齿科技赋能央国企数字化转型，荣登2024爱分析全景报告榜单

04-22

无招回归钉钉，能否重塑产品导向，再掀协同办公新篇章？

OpenAI推出应用商店GPTStore后，钉钉去年也紧跟着推出了“AI助理”市场，打造AI助理的分发和交易平台，目标是在未来三年里在钉钉上孵化1000万个AI助理。他同时提到，AI在办公场景很有潜力，…

04-22

点击查看更多 +

全站最新

九号电动2024年高光时刻：智能引领，重塑出行未来

Vidu Q1问鼎VBench榜首，视频大模型新王者诞生！

雷克萨斯全新ES首发，电动化转型外形大变，你会买单吗？

腾势Z双门跑车亮相上海车展，性能媲美保时捷911，价格仅30多万？

名侦探柯南第30部剧场版：青山刚昌透露将有重磅内容？

英特尔陈立武大动作！上任首月即宣布大裁员与业务重组

热门内容

本栏最新

Vidu Q1问鼎VBench榜首，视频大模型新王者诞生！

米哈游璃月科技公司大幅增资，资本金跃升至4亿，涨幅高达150%

罗盘Compass Copilot：企业大模型应用搭建的新引擎

小米5月下旬新品爆发：手机平板眼镜手表，你期待哪一款？

德施曼2025新品盛宴：AI智能管家Miya引领智能锁新纪元！

三七互娱年度分红22亿，游戏巨头为何热衷回馈股东？

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.