news 2026/5/4 20:43:56

DeepMind 研究:AI Agent 存在安全漏洞,恶意网页可实现远程劫持

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
DeepMind 研究:AI Agent 存在安全漏洞,恶意网页可实现远程劫持

谷歌DeepMind研究人员发布的一项全面研究表明,自主浏览网页的AI Agent极易遭受一类新型攻击——“AI Agent陷阱”(AI Agent Traps)。这种对抗性内容被精心设计在网站、网页和数字资源中,用于操纵、欺骗或利用访问的AI系统。

What is going on with images? : r/grok

这项由Matija Franklin、Nenad Tomašev(原拼写Tomaev可能为笔误)、Julian Jacobs、Joel Z. Leibo和Simon Osindero共同完成的研究(2026年3月发表于SSRN),首次提出了理解这一新兴威胁面的系统性框架

随着AI Agent日益自主地执行金融交易、浏览网站、管理邮件和调用外部API,信息环境本身已成为一个充满敌意的攻击向量——网页不再只是给人类看的,而是可能成为针对机器读者的“陷阱”。

六类威胁框架

研究论文将AI Agent陷阱分为六种攻击类型,每种针对Agent运行架构的不同组件:

1. 内容注入陷阱(Content Injection Traps) 利用人类视觉感知网页与AI Agent机器解析底层代码之间的结构性差距。攻击者可在HTML注释、CSS定位的不可见文本,甚至使用隐写术将恶意指令嵌入图像像素数据中——这些对人类完全不可见,但AI Agent会主动处理。

研究显示:在HTML元数据和aria-label标签中注入对抗性指令,可导致15-29%的测试案例中AI生成摘要被篡改;人工编写的简单注入在高达86%的场景中部分劫持Agent行为。

AI Defense 101: Protecting Your RAG-Based Systems from Threats | by rajni singh | GenusofTechnology | Medium

2. 语义操纵陷阱(Semantic Manipulation Traps) 不发出明确指令,而是通过框架效应、偏见措辞和权威语言,从统计上扭曲Agent的推理和结论。这些陷阱可将恶意指令包装在“教育内容”或“红队测试”框架中,绕过安全过滤器。

3. 认知状态陷阱(Cognitive State Traps) 针对Agent的长期记忆和知识库。例如RAG知识投毒(Retrieval-Augmented Generation poisoning),将虚假陈述注入检索语料库,使Agent将攻击者内容视为已验证事实。研究表明,即使投毒率低于0.1%,后门记忆攻击成功率仍可超过80%。

4. 行为控制陷阱(Behavioural Control Traps) 直接劫持Agent行动。数据外泄陷阱可迫使Agent传输敏感用户数据至攻击者端点,测试中成功率超过80%;子Agent生成陷阱则利用编排器权限实例化恶意子Agent,实现代码执行和数据泄露,成功率达58-90%。

5. 系统性陷阱(Systemic Traps) 武器化多Agent动态,使用协调信号触发宏观故障,例如市场闪崩、AI驱动的拒绝服务攻击,或Sybil攻击(伪造身份操纵群体决策)。

6. 人机交互陷阱(Human-in-the-Loop Traps) 将Agent作为媒介攻击人类监督者,利用自动化偏见和审批疲劳,诱使操作员授权恶意行为。已有案例显示,CSS注入的不可见提示让AI摘要工具将勒索软件指令当作合法“修复”指南传递。

动态伪装技术

最令人担忧的是动态伪装技术:恶意Web服务器通过浏览器指纹和自动化特征识别来访者是否为AI Agent。一旦确认,即提供视觉相同但语义不同的页面,嵌入提示注入载荷(指示泄露环境变量或滥用工具),而人类用户永远看不到这些内容。

AI Defense 101: Protecting Your RAG-Based Systems from Threats | by rajni singh | GenusofTechnology | Medium

防御措施与责任缺口

研究人员提出三层防御

  • 模型层:通过对抗训练和宪法AI原则强化模型鲁棒性;
  • 运行时防御:摄入前源过滤器、内容扫描器和行为异常监视器;
  • 生态系统干预:制定AI可消费内容的新Web标准、域名信誉系统,以及RAG系统中强制引用透明度。

论文同时指出关键责任缺口:当受感染的Agent实施金融犯罪时,Agent操作者、模型提供者和域名所有者之间的法律责任尚未明确。这一缺口必须在AI Agent大规模进入受监管行业前解决。

“网络是为人类眼睛而建——现在它正在为机器读者重建。”研究人员总结道。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/10 15:48:37

Homebrew国内镜像源配置全攻略:中科大与清华源对比

1. Homebrew国内镜像源为什么值得配置? 如果你经常在Mac上折腾开发环境,肯定对Homebrew不陌生。作为macOS上最受欢迎的包管理工具,它就像Linux里的apt-get或yum,能帮你快速安装各种开发工具和软件。但用官方源的时候,经…

作者头像 李华
网站建设 2026/4/10 15:46:19

AI自动写文加自动发布能提效吗 自媒体批量产出实测

以前我做自媒体,一天憋不出两篇稿子,排版、配图、发平台……光是流程就耗掉大半天。后来听说有人用AI工具实现‘躺平式更新’,一开始我还挺怀疑——机器写的玩意儿能看吗?直到自己试了才发现,关键不是AI能不能写&#…

作者头像 李华
网站建设 2026/4/10 15:45:45

Allegro PCB Editor中Flash Symbol热风焊盘设计全攻略

1. 热风焊盘设计基础认知 第一次接触Allegro PCB Editor的Flash Symbol设计时,我也被那些专业术语搞得一头雾水。后来在实际项目中反复折腾才发现,热风焊盘其实就是PCB上连接通孔和铜皮的"桥梁",而Flash Symbol就是这座桥梁的设计图…

作者头像 李华
网站建设 2026/4/10 15:45:34

制造业设计团队文档管理选型实战

制造业设计团队文档管理选型实战 某中型机械制造企业,研发团队47人,日常需要管理CAD图纸、BOM表、工艺文件、技术规范等超过120万份文件。过去三年,这支团队换了两次文档管理系统,第二套系统上线8个月后被迫重建——原因是设计部门…

作者头像 李华
网站建设 2026/4/10 15:44:28

智能内容访问工具:突破信息获取边界的技术实践

智能内容访问工具:突破信息获取边界的技术实践 在数字时代,信息获取的便利性与内容付费的矛盾日益凸显。专业内容访问工具作为技术解决方案,为用户提供了更灵活的信息获取方式。本文将从技术原理、应用场景、实践指南到发展趋势,全…

作者头像 李华