奥特曼公司在科技界的又一次重大动作引发了广泛关注。近日,该公司宣布推出两款全新的o系列模型——满血版o3和o4-mini,这两款模型不仅性能强劲,而且能够无缝集成ChatGPT中的多种工具,涵盖图像生成、图像分析、文件解释、网络搜索以及Python编程等多个领域。
据奥特曼公司介绍,这两款新模型相较于前代产品,在性能上有了显著提升,同时价格更加亲民。消息一经发布,立即引发了科技爱好者的热烈讨论和测试。
网友们纷纷晒出了对新模型的测试结果,其中“小球测试”的结果尤为引人注目。一位网友表示:“这是我迄今为止看到的最好的测试结果,o3和o4-mini的表现确实令人惊叹。”在HLM基准测试中,这两款新模型也迅速攀升至榜单前三,其强大的性能让业内人士和网友们大呼震惊。
从官方数据来看,o3在多个基准测试中刷新了纪录,包括Codeforces、SWE-bench和MMMU等。在应对复杂现实任务时,o3相比OpenAI o1减少了20%的重大错误,尤其在编程、商业咨询和创意构思方面表现出色。而o4-mini虽然体积小巧,但专为快速、高效的推理任务而设计,支持更高的使用频率。在数学、编程和视觉任务上,o4-mini同样表现出色,在2025年AIME数学竞赛中,借助Python解释器的帮助,取得了接近满分的优异成绩。
o3和o4-mini首次实现了将图像直接融入思维链的能力。它们不仅能够“看见”图像,更能“通过图像思考”,这一创新带来了视觉与文本推理的全新融合方式,显著提升了模型在多模态任务中的表现。OpenAI图像推理研究员Jiahui Yu表示:“自o系列推出以来,‘图像思考’始终是我们感知领域的核心战略之一。如今,随着o3和o4-mini的发布,这一战略终于以更为成熟和完整的形式落地。”
这两款新模型能够自由调用ChatGPT中的各种工具,这一能力让模型从“聪明大脑”进化为“灵巧双手”。网友们纷纷尝试利用这一新功能,发现模型能够轻松完成跨工具的任务,带来了前所未有的便捷体验。OpenAI首席研究官Mark Chen表示:“一旦推理模型学会了端到端地使用工具,它们就会变得更加强大。最新的o系列模型正是我们向未来迈出的重要一步。”
除了新模型的发布,奥特曼公司还开源了一款本地代码智能体——Codex CLI。这款轻量级的编码助手能够直接在用户的终端命令行中运行,充分发挥o3、o4-mini等模型的推理能力,紧密连接本地开发环境。未来,Codex CLI还将支持GPT 4.1等其他模型,为开发者提供更加便捷、高效的编码体验。Codex CLI甚至支持通过截图或手绘草图进行多模态编程,这一创新功能刷新了代码交互与内容理解的边界。