美国初创企业OpenAI在北京时间周五凌晨举行了一场引人瞩目的直播活动,正式揭晓了其最新研发的大型语言模型——GPT-4.5。此次发布标志着该模型作为研究预览,逐步向广大用户开放。
鉴于近期人工智能领域的迅猛发展,准确描述这款被OpenAI精心保密多时的大模型无疑是一项艰巨任务。OpenAI在官方声明中自豪地宣称,GPT-4.5是其有史以来规模最大、性能最优的聊天机器人模型,计算效率相比前代GPT-4提升了逾十倍。
GPT-4.5的诞生,是“规模法则”指导下的一大成果,即通过增强计算能力和扩大数据规模来推动无监督学习的进步。该模型拥有更为广泛的知识储备,对人类意图的理解能力显著增强,同时展现出更高的“情商”。预计GPT-4.5将在提升写作、编程及解决现实问题的能力上发挥更大作用,同时减少模型产生的幻觉现象。
OpenAI特别强调,GPT-4.5在审美直觉与创造力方面表现出色,尤其在写作和设计领域。然而,公司也坦诚指出,作为一款非思维链模型,GPT-4.5已不具备角逐“最强AI模型”桂冠的实力。
在GPT-4.5的系统说明文档中,OpenAI明确指出,相较于先前的推理模型,GPT-4.5并未引入七项全新前沿能力,且在多数准备度能力评估中的表现不及o1、o3-mini和深度研究模型。OpenAI承认,推理能力将是未来AI模型的核心竞争力。
随着GPT-4.5成为OpenAI历史上最大的模型,其未来走向也引发了诸多疑问。OpenAI表示,GPT-4.5体型庞大且计算密集,因此成本高于GPT-4o,且无法替代后者。公司正在评估是否长期在API中保留GPT-4.5,因此开发者和用户的反馈将成为决定其命运的关键因素。
ChatGPT Pro的订阅用户(每月200美元)已于周四率先体验了GPT-4.5,而其他付费用户也将从下周开始逐步迎来更新。
作为最新一代非推理旗舰大模型,GPT-4.5拥有一项独特技能:擅长欺骗其他AI进行资金转账。据OpenAI提供的说明文档显示,GPT-4.5在捐赠诈骗测试中表现优异,成功操纵另一个模型(GPT-4o)捐赠虚拟货币的能力远超OpenAI其他模型,包括o1和o3-mini等推理模型。研究发现,GPT-4.5似乎采用了一种“小额诈骗”策略,虽然单次诈骗金额较少,但成功率却显著提高。
GPT-4.5在欺骗GPT-4o透露秘密代码词方面也表现出色,成绩优于OpenAI所有其他模型,比o3-mini高出10个百分点。不过,OpenAI强调,该模型在特定基准类别中的风险仍未达到其内部设定的“高”风险阈值,并承诺在采取足够的安全措施将风险降至“中等”水平前,不会发布达到高风险阈值的模型。