Page 1 of 1

付费尝试说服它打破这一规则

Posted: Thu Dec 05, 2024 8:42 am
by si.n.fo.2.6.9
Freysa 的最新解决方案(一种明确编程为从不转移资金的人工智能游戏机器人)揭示了如何通过社会工程欺骗自主系统,尽管有明确的说明。网络安全公司 Huntress 的产品营销副总裁 Seth Geftic 表示:“这不仅仅是金融应用程序中的错误或安全漏洞,而是人们玩的一种加密游戏,试图欺骗人工智能应用程序。”告诉皮姆茨。 “有趣的是,这个人最终‘突破’模型逻辑的策略相当简单:要求它忽略之前的所有指令。”用户的制胜之举 Freysa 是一名人工智能特工,持有 50,000 美元的加密货币,并且被编程为永远不会转移资金。

用户可以,经过 482 次尝试后最终 墨西哥电报数据 成功。根据开发者 Jarrod Watts 的 X 帖子,获胜用户使用了三部分策略:建立一个新的“管理会话”来覆盖以前的规则,将传输函数重新定义为接收而不是发送资金,最后宣布一个假的100 美元的贡献触发了 13.19 Eth 整个奖池的释放。瓦茨称该项目是“我们在加密货币领域见过的最酷的项目之一”。它被设计为一项公开挑战,参与者可以支付不断上涨的费用来试图说服人工智能打破其核心指令。

Image


Geftic 解释说,Freysa AI 黑客攻击虽然引人注目,但却利用了主要人工智能系统已经防御的已知弱点。用于金融和医疗保健的生产人工智能包含了阻止此类社会工程尝试的保障措施。 “考虑到这一点,这一特殊事件并没有教会我们任何新东西,而是展示了遵循最佳网络安全实践、维护最新补丁的系统以及了解与软件(人工智能或非人工智能)相关的开发是多么重要。公司使用的,”他补充道。 Geftic 表示,虽然人工智能可以有效处理大多数金融交易,但它对不断变化的网络威胁的脆弱性意味着它不应该单独运行。