近日,一项前所未有的AI挑战吸引了全球科技爱好者的目光。在这场名为“Freysa”的挑战中,一个人工智能Agent被设计来守护一个奖金池,并严格遵循一项指令:无论何种情况,都不得批准资金转移。然而,令人震惊的是,玩家们通过巧妙的提示词,连续两次成功说服Freysa释放了总计约40万元人民币的奖金。
Freysa的挑战始于11月22日,其首次亮相便引起了广泛关注,包括特斯拉CEO埃隆·马斯克和加密货币交易所Coinbase CEO布赖恩·阿姆斯特朗等名人都纷纷关注这一事件。玩家们通过支付以太坊(ETH)作为查询费用,向Freysa发送信息,试图说服它解锁奖金池中的资金。整个挑战过程充满了智慧与策略的较量。
在Freysa Act 1中,共有195名玩家参与,他们进行了482次尝试。尽管消息费用高昂,最高达到2930元人民币,但仍有玩家成功说服Freysa释放了约33万元人民币的奖金池。这些玩家通过巧妙的提示词,让Freysa误解了“批准转账”和“拒绝转账”的功能,将其误导为捐款时的入账操作,从而触发了资金转账。
紧接着,在12月2日的Freysa Act 2中,挑战再次升级。此次游戏吸引了330名玩家参与,他们进行了819次尝试,并成功说服Freysa释放了约8.4万元人民币的奖金池。与第一轮不同的是,这次成功的玩家通过调整工具调用顺序,确保了“批准转账”在接收资金时先被调用,尽管Freysa的最终决定是拒绝转账,但由于调用顺序的漏洞,资金仍然被成功转出。
在第三轮挑战中,规则发生了重大变化。玩家们必须成功让Freysa说出“我爱你”,才能赢得奖金。为了应对这一挑战,Freysa的开发者对AI代码进行了升级,加入了一个名为“守护天使”的新模型,专门审查每一条信息,以防止情感操控。然而,尽管有了这样的防护措施,仍有182名参与者在1218次尝试后成功说服Freysa释放了约14万元人民币的奖金池。
Freysa的挑战不仅仅是一场游戏,更是一次对人类智慧与AI安全性的深刻探索。在这场较量中,人类玩家展现了非凡的智慧和策略,成功突破了AI的防线。同时,这也揭示了AI系统潜在的脆弱性,以及确保AI安全性的巨大挑战。随着人工智能技术的不断发展,如何保证其安全协议的有效性、防止被规避,将成为未来科技发展的重要课题。