【ITBEAR科技资讯】9月11日消息,蚂蚁集团今日宣布推出一项创新性的大模型安全解决方案,命名为“蚁天鉴”。这一方案旨在应对大模型在生产和使用过程中的安全挑战,包括AIGC安全性和真实性评估、智能风险防控、以及AI鲁棒性和可解释性检测等多项关键功能。这是迄今为止首个针对大型AI模型的产业级应用安全检测与防御一体化解决方案。蚁天鉴包括两大核心产品:大模型安全检测平台“蚁鉴2.0”和大模型风险防御平台“天鉴”,而这两款产品已对外开放。
蚂蚁集团的工作人员指出,大模型在安全方面面临三大主要问题源,包括“用于训练的数据源头有毒、推理过程不可控、外部恶意诱导”。为解决这些问题,蚁天鉴聚焦于大模型安全性检测度量、智能风险防控、以及数据清洗等领域,以确保大型AI模型在生产和使用中更加安全、可控和可靠。
根据ITBEAR科技资讯了解,其中的“蚁鉴2.0”是首个支持文本、图像等多种数据类型的产业级AI安全检测平台。它通过智能攻击对抗技术,模拟黑客攻击的方式,生成大量诱导性问题,然后对大型AI模型的回答进行实时自动化检测,以识别潜在的弱点和安全问题。此外,“蚁鉴2.0”还具备了对AIGC生成的图片、视频等多模内容进行“真伪”辨别和安全性检测的能力,可快速区分内容是否由机器生成,以及是否存在伦理和道德风险。
另一方面,“天鉴”则扮演着外部恶意攻击的防护盾角色,借助智能风险控制技术,保护大模型免受外界恶意提问的侵害,并过滤生成的回答内容,确保整个过程安全可靠。据了解,“天鉴”平台不仅可以在用户输入阶段快速理解意图和风险,还能以不同的风险控制方式来应对,同时也能够迅速提升大模型的风险认知和防御能力,同时保障用户体验,确保输出内容合规且健康。
总之,蚂蚁集团的“蚁天鉴”为大型AI模型的安全性带来了全新的解决方案,通过综合考虑安全检测、智能风险防御和数据清洗等关键环节,为大型AI模型的应用提供了更可靠的保护。