【ITBEAR】8月10日消息,OpenAI公司于近日发布了一份详尽报告,揭示了GPT-4o模型的系统卡(System Card)内容,其中包含了外部红队测试、准备框架(Preparedness framework)等多个关键细节。
报告指出,GPT-4o模型的核心在于其独特的准备框架(Preparedness framework),这是一种系统性的方法,旨在评估并降低人工智能系统所带来的风险。据ITBEAR了解,该框架的应用范围广泛,覆盖了网络安全、生物威胁、说服技巧以及模型自主性等多个领域,致力于识别这些领域内可能存在的潜在危险。
除了对GPT-4和GPT-4V进行的安全评估和缓解措施外,OpenAI还针对GPT-4o的音频功能加强了安全工作。这些评估涵盖了扬声器识别、未经授权的语音生成、可能侵犯版权的内容生成、无根据的推断以及不允许的内容等多个方面。基于这些细致的评估结果,OpenAI在模型和系统层面均实施了相应的保障措施,以确保其音频功能的稳健性和安全性。
在模型发布之前,OpenAI还与100多名外部红队人员进行了紧密合作,共同对模型进行了全面的评估。这些红队人员负责进行探索性的能力发现,评估模型可能带来的新风险,并对已实施的缓解措施进行了严格的压力测试,以确保模型在实际应用中的稳定性和安全性。