近期,科技界迎来了一场引人瞩目的盛宴,OpenAI在其“连续12日圣诞发布”活动中,终于揭晓了备受期待的终极产品——o3,这一前沿推理模型的升级版,被誉为OpenAI迄今最强的技术结晶。
据OpenAI透露,o3在某些特定条件下已接近通用人工智能(AGI)的水平,并同时推出了o3及其精简版本o3-mini,以满足不同用户的需求。
在各类评估中,o3展现出了惊人的实力。在软件工程测试中,其准确率相比前代o1提升了近47%;在竞赛数学测评中,准确率提高了15%;而在人类博士专家级的生化物测试中,o3的准确率也比o1高出近13%。在AGI相关测试中,o3更是取得了87.5分的佳绩,超过了人类水平的门槛85分,标志着向类人智能迈出了重要的一步。
与之形成鲜明对比的是,GPT-3在这一测试中的得分为0%,GPT-4o也仅为5%,而o3则一举将成绩提升至87.5%,展现出了其强大的推理和学习能力。
OpenAI计划在明年初正式发布o3系列模型,但CEO Altman表示,这类模型可能不会立即面向大众上线。他强调,在正式发布前,需要有一个联邦政府的测试框架来指导、监控并减少这类模型可能带来的风险。
从本周五开始,OpenAI已允许安全研究人员注册访问o3和o3-mini的预览版,以进一步评估和优化这些模型。
回顾OpenAI此次的12天技术直播,亮点频出。除了重磅推出的o3模型外,OpenAI还带来了“满血版”推理模型o1和ChatGPT Pro,后者每月订阅费为200美元。同时,OpenAI还推出了强化微调研究项目,能够使用数十到数千个高质量任务来定制模型,以满足特定需求。
OpenAI还正式推出了AI视频生成模型Sora Turbo,支持最高1080p 20s的视频生成。升级版Canvas创作助手也向全量用户开放,主打高效编程与写作。与苹果的合作更是将Siri、写作工具和Visual Intelligence与ChatGPT深度集成,为用户带来了全新的体验。
OpenAI还全量上线了4o视频通话功能,能够实时对话并理解用户的连续性动作,同时还具备记忆能力。Projects In ChatGPT的推出,则整合了ChatGPT的各种功能,便于用户创建及管理项目。ChatGPT搜索功能也得到了全面升级,新增了地图集成、实时搜索等功能,并向所有用户开放。
在API方面,OpenAI开放了满血o1模型API,实时API直接支持WebRTC,且定价降低了60%。同时,ChatGPT也入驻了手机平台,用户拨打免费号码即可连接聊天机器人,每月可免费通话15分钟。OpenAI还支持了原生应用程序自动化协作功能,能够主动理解用户需求,为用户提供更加便捷的服务。