滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

OpenAI o3模型登场，能否成为通用人工智能新里程碑？

时间：2024-12-21 08:11:15 来源：ITBEAR编辑：快讯团队 发表评论无障碍通道

在近期科技界的重大事件中，OpenAI公司的“12 Days of OpenAI”活动圆满落幕，这一活动的压轴大戏是o3系列大模型的惊艳亮相。据官方透露，o3在某些应用场景下的推理能力已逼近通用人工智能（AGI）的水平，这一消息引起了业界的广泛关注。

关于o3的命名，OpenAI首席执行官山姆·阿尔特曼在一场直播活动中给出了答案。他解释称，为了避免与英国电信运营商O2的商标产生冲突，公司决定跳过o2，直接将最新模型命名为o3。这一决定不仅彰显了OpenAI在命名上的创意，也体现了其对法律风险的谨慎考量。

o3作为o1推理模型的升级版，推出了完整版和精简版（o3-mini）两个版本。其中，o3-mini针对特定任务进行了优化，以满足不同用户的需求。然而，OpenAI并未立即全面开放这两款模型，而是先邀请安全研究人员注册测试预览版o3-mini，待测试稳定后再推出o3预览版。这一举措不仅有助于提升模型的安全性，还能为后续的全面开放打下坚实基础。

对于感兴趣的公众而言，他们可以通过OpenAI的官方网站提交申请，参与安全测试。虽然阿尔特曼并未透露o3模型的具体开放日期，但他表示o3-mini将在2025年1月底推出，随后再推出o3。这一消息无疑让众多AI爱好者充满了期待。

o3模型与主流AI模型的一个显著区别在于其事实核查功能。这一功能能够帮助o3规避一些常见的模型陷阱，但也会带来一定的响应延迟。根据推理难度的不同，延迟时间通常在几秒到几分钟之间。o3还采用了“私人思想链”进行思考，能够在响应前暂停并考虑相关提示，最终给出最准确的答案。

o3模型还具备调整推理时间的新功能，用户可以根据需要选择低、中、高三种计算级别。计算级别越高，o3的任务执行性能就越好。这一功能为用户提供了更加灵活的使用体验。

在性能方面，o3模型在多个基准测试中均表现出色。在ARC-AGI基准测试中，o3在高计算设置下获得了87.5%的分数，在低计算设置下得分为75.7%，性能是o1的三倍。在SWE-Bench Verified编程任务基准测试、Codeforces编程技能测试、2024年美国数学邀请赛以及GPQA Diamond研究生水平生物、物理和化学测试中，o3均取得了优异的成绩。

这些成绩不仅证明了o3模型的强大实力，也为其在通用人工智能领域的进一步发展奠定了坚实基础。然而，随着o3能力的不断提升，其潜在风险也日益凸显。OpenAI承诺将致力于模型安全，并与其他机构合作构建更加完善的基准测试体系，以确保o3能够在安全可控的范围内发挥最大效用。

o3的发布对于OpenAI与微软之间的合作关系也产生了重要影响。根据双方的交易条款，一旦OpenAI达到AGI水平，公司将不再有义务向微软提供其最先进的技术。这意味着o3的成功发布不仅标志着OpenAI在通用人工智能领域迈出了重要一步，也可能对其与微软的合作关系产生深远影响。

举报 0 收藏 0 打赏 0评论 0

更多>同类资讯

闲鱼AI新突破：超级智能体引领闲置交易革命

04-18

用友BIP新品重磅发布：智驱制造，助力企业质优本降效增！

04-18

联想创新科技大会：揭秘AI新品，人形机器人或成数字生活新桥梁？

04-18

食博会·预博会和农博会东莞启幕，AI智慧农食展新风采！

04-18

测测达人携手FARMER BOB：春日治愈行动，让情绪找到回响

04-18

闪迪创作者系列全新上市，专业存储方案赋能内容创作者高效产出

04-18

AI造游戏，路还长吗？

04-18

智谱AI获多方青睐，北京基金再追投2亿助力开源生态建设

04-18

智平方AlphaBot 2升级亮相：DeepSeek技术赋能，开启通用智能新篇章

04-18

谷歌Gemini 2.5 Flash突破性发布：成本大幅降低，性能依旧强劲

04-18

关税风暴中，全球AI产业如何破局前行？

此外，由于对等关税大棒给全球经济体都造成了冲击，由此产生对美国技术生态体系的不信任，或许也是一个中国AI合纵连横的窗口期，来增强中国AI技术生态的韧性，比如，吸引海外开发者使用国产化AI框架、开发工具、AI…

04-18

银行业科技投入分化，大模型应用深度融入核心业务成亮点

对此，钛媒体App重点梳理了10家银行（包括国有六大行和招行、中信、平安、兴业4家股份行）财报，以此一窥国内头部银行的最新科技故事。总的来说，虽然智能客服、代码助手等已是普遍应用，但上述银行在专业领域的深…

04-18

讯飞双屏翻译机2.0新品发布：智能升级，让跨境沟通无界高效！

04-18

萝卜快跑海南布局再落一子，新公司注册资本达百万

04-18

AMD GPU大飞跃！Stable Diffusion模型性能提升最高达3.8倍

04-18

点击查看更多 +

全站最新

科沃斯地宝mini：史上最小全能基站扫拖机器人，2199元起售！

哪吒汽车前CEO张勇微博公开，身居英国仍称助力融资

vivo X200s全面融入苹果生态，iPhone用户无缝换机新选择！

长安Lumin微型电车萌动上市，补贴后仅需2.59万起，性价比如何？

LG手机正式谢幕：2025年6月30日后终止所有服务

极氪法务部维权成功！自媒体“车曝台”被判道歉并赔偿30万

热门内容

本栏最新

闲鱼AI新突破：超级智能体引领闲置交易革命

用友BIP新品重磅发布：智驱制造，助力企业质优本降效增！

联想创新科技大会：揭秘AI新品，人形机器人或成数字生活新桥梁？

食博会·预博会和农博会东莞启幕，AI智慧农食展新风采！

测测达人携手FARMER BOB：春日治愈行动，让情绪找到回响

闪迪创作者系列全新上市，专业存储方案赋能内容创作者高效产出

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.