滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

OpenAI新监控系统上线，能否有效遏制AI模型的生物化学风险？

时间：2025-04-17 12:30:33 来源：ITBEAR编辑：快讯团队 发表评论无障碍通道

人工智能巨头OpenAI近日公布了一项重要安全举措，针对其最新研发的人工智能推理模型o3和o4-mini，部署了一套全新的监控系统。这一系统的主要目的是防范模型提供可能引发生物和化学威胁的有害信息。

据OpenAI的安全报告显示，随着o3和o4-mini模型能力的显著提升，也带来了新的安全隐患。特别是o3模型，在OpenAI的内部基准测试中展现出对制造某些类型生物威胁问题的高度敏感性。为此，OpenAI开发了名为“安全导向推理监控器”的新系统，旨在确保模型不会为潜在的有害行为提供指导。

这套监控器经过专门训练，能够深入理解OpenAI的内容政策，并实时运行在o3和o4-mini模型之上。它的核心功能是识别与生物和化学风险相关的提示词，一旦检测到这些关键词，就会指示模型拒绝提供任何相关建议。

为了验证监控器的有效性，OpenAI的红队成员投入了大量时间进行标记工作，他们标记了o3和o4-mini中与生物风险相关的“不安全”对话样本。在模拟测试中，监控器展现出了出色的性能，成功阻断了98.7%的风险提示。然而，OpenAI也坦诚地指出，测试并未涵盖用户尝试新提示词以规避监控的情况，因此仍需依赖部分人工监控来弥补这一潜在漏洞。

尽管o3和o4-mini尚未达到OpenAI设定的生物风险“高风险”阈值，但与早期的o1模型和GPT-4相比，它们在回答有关开发生物武器的问题上表现出了更高的帮助性。这引起了OpenAI的高度关注，公司正在积极跟踪其模型可能如何被恶意用户利用，以开发化学和生物威胁。

OpenAI在降低模型风险方面正越来越多地依赖自动化系统。例如，为了防止GPT-4o的原生图像生成器创建儿童性虐待材料（CSAM），OpenAI同样采用了与o3和o4-mini相似的推理监控器技术。

然而，并非所有人都对OpenAI的安全措施持乐观态度。一些研究人员对OpenAI的安全承诺表示质疑，认为公司在安全问题上的重视程度并未达到人们的期望。特别是OpenAI的红队合作伙伴Metr，他们在测试o3的欺骗性行为基准时面临时间限制，这引发了他们对测试充分性的担忧。OpenAI决定不为其最新发布的GPT-4.1模型发布安全报告，这一举动也引发了一些争议。

尽管存在这些质疑，OpenAI仍然坚持其安全导向的原则，并不断努力提升模型的安全性能。随着人工智能技术的不断发展，如何在提升模型能力的同时确保安全性，将是OpenAI等人工智能公司面临的重要挑战。

同时，OpenAI也呼吁社会各界共同关注人工智能的安全问题，加强合作与交流，共同推动人工智能技术的健康发展。

举报 0 收藏 0 打赏 0评论 0

更多>同类资讯

RunningHub携FramePack插件，开启长视频创作无硬件限制新纪元

04-18

闲鱼AI新突破：超级智能体引领闲置交易革命

04-18

用友BIP新品重磅发布：智驱制造，助力企业质优本降效增！

04-18

联想创新科技大会：揭秘AI新品，人形机器人或成数字生活新桥梁？

04-18

食博会·预博会和农博会东莞启幕，AI智慧农食展新风采！

04-18

测测达人携手FARMER BOB：春日治愈行动，让情绪找到回响

04-18

闪迪创作者系列全新上市，专业存储方案赋能内容创作者高效产出

04-18

AI造游戏，路还长吗？

04-18

智谱AI获多方青睐，北京基金再追投2亿助力开源生态建设

04-18

智平方AlphaBot 2升级亮相：DeepSeek技术赋能，开启通用智能新篇章

04-18

谷歌Gemini 2.5 Flash突破性发布：成本大幅降低，性能依旧强劲

04-18

关税风暴中，全球AI产业如何破局前行？

此外，由于对等关税大棒给全球经济体都造成了冲击，由此产生对美国技术生态体系的不信任，或许也是一个中国AI合纵连横的窗口期，来增强中国AI技术生态的韧性，比如，吸引海外开发者使用国产化AI框架、开发工具、AI…

04-18

银行业科技投入分化，大模型应用深度融入核心业务成亮点

对此，钛媒体App重点梳理了10家银行（包括国有六大行和招行、中信、平安、兴业4家股份行）财报，以此一窥国内头部银行的最新科技故事。总的来说，虽然智能客服、代码助手等已是普遍应用，但上述银行在专业领域的深…

04-18

讯飞双屏翻译机2.0新品发布：智能升级，让跨境沟通无界高效！

04-18

萝卜快跑海南布局再落一子，新公司注册资本达百万

04-18

点击查看更多 +

全站最新

AI重塑汽车产业链：数商云需求预测模型误差率降至3%引领革新

优科豪马智能工厂加速建设，年产1400万条PCR轮胎即将诞生！

哪吒汽车原CEO张勇澄清：微博已开放三年，logo设计费未超百万

广汽引领智能驾驶安全新风尚，重构行业底线何在？

佛山电翰关联企业频现经营异常，背后原因何在？

上汽大象起舞：传统巨头转型，能否迎来新生“破壁”时刻？

热门内容

本栏最新

RunningHub携FramePack插件，开启长视频创作无硬件限制新纪元

闲鱼AI新突破：超级智能体引领闲置交易革命

用友BIP新品重磅发布：智驱制造，助力企业质优本降效增！

联想创新科技大会：揭秘AI新品，人形机器人或成数字生活新桥梁？

食博会·预博会和农博会东莞启幕，AI智慧农食展新风采！

测测达人携手FARMER BOB：春日治愈行动，让情绪找到回响

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.