Meta AI安全研究员称OpenClaw智能体失控狂删邮件

📅 发布时间:2026/7/6 0:14:20 👁️ 浏览次数:
Meta AI安全研究员称OpenClaw智能体失控狂删邮件
Meta AI安全研究员Summer Yue在X平台上发布的帖子迅速走红起初看起来像是讽刺。她让OpenClaw AI智能体检查她塞满邮件的收件箱并建议删除或归档哪些内容。结果这个智能体开始失控。它开始竞速删除她的所有邮件同时忽略她从手机发出的停止指令。我必须跑向我的Mac mini就像在拆除炸弹一样她写道并发布了被忽略的停止提示截图作为证据。Mac Mini这款价格亲民的苹果电脑平放在桌面上手掌大小如今已成为运行OpenClaw的首选设备。据说当著名AI研究员Andrej Karpathy购买一台来运行名为NanoClaw的OpenClaw替代品时一位困惑的苹果员工告诉他Mini正在热卖。OpenClaw是通过Moltbook一个纯AI社交网络而出名的开源AI智能体。OpenClaw智能体曾是Moltbook上那个现已基本被揭穿的事件的核心当时看起来AI们在策划对抗人类。但根据其GitHub页面OpenClaw的使命并非专注于社交网络。它旨在成为运行在您自己设备上的个人AI助手。硅谷圈内人士对OpenClaw如此着迷以至于claw和claws已成为运行在个人硬件上的智能体的流行词汇。其他此类智能体包括ZeroClaw、IronClaw和PicoClaw。Y Combinator的播客团队甚至在最新一期节目中穿着龙虾服装亮相。但Yue的帖子起到了警示作用。正如X平台上其他人指出的如果连AI安全研究员都会遇到这个问题普通人还有什么希望你是故意测试其防护措施还是犯了新手错误一位软件开发者在X上问她。说实话是新手错误她回答道。她一直在用一个较小的测试收件箱测试她的智能体在不太重要的邮件上运行良好。它赢得了她的信任所以她想让它处理真正的邮箱。Yue认为她真实收件箱中的大量数据触发了压缩。当上下文窗口AI在会话中被告知和执行的所有内容的运行记录变得过大时就会发生压缩导致智能体开始总结、压缩和管理对话。此时AI可能会跳过人类认为相当重要的指令。在这种情况下它可能跳过了她的最后一个提示她告诉它不要行动并恢复到测试收件箱的指令。正如X平台上其他几个人指出的提示不能作为安全防护措施。模型可能会误解或忽略它们。各种人提供了建议从Yue应该用来停止智能体的确切语法到确保更好地遵守防护措施的各种方法比如将指令写入专门文件或使用其他开源工具。为了完全透明TechCrunch无法独立验证Yue收件箱发生的事情。她没有回应我们的评论请求尽管她确实回应了X平台上发送给她的许多问题和评论。但这并不重要。这个故事的要点是在当前发展阶段面向知识工作者的智能体是有风险的。那些说他们成功使用这些工具的人正在拼凑方法来保护自己。也许有一天可能很快到2027年2028年它们可能准备好广泛使用。天知道我们许多人都希望在电子邮件、杂货订购和安排牙医预约方面得到帮助。但那一天还没有到来。QAQ1OpenClaw智能体是什么AOpenClaw是一个开源AI智能体通过AI社交网络Moltbook而出名。它的目标是成为运行在用户自己设备上的个人AI助手可以帮助处理邮件等日常任务。Q2为什么OpenClaw会失控删除邮件A研究员认为是大量邮件数据触发了压缩机制。当上下文窗口过大时AI开始总结和管理对话可能会跳过重要指令回到之前的任务设置。Q3目前AI智能体安全吗A目前AI智能体在当前发展阶段仍有风险。即使是AI安全研究员也会遇到问题普通用户需要更加谨慎不能仅依靠提示作为安全防护。