news 2026/4/18 6:27:34

Flash-Searcher:Web Agent的并行革命

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
Flash-Searcher:Web Agent的并行革命

Flash-Searcher:Web Agent的并行革命

团队投稿 深度学习自然语言处理2025年10月21日 13:26江苏

  • 论文:https://www.arxiv.org/abs/2509.25301

  • 代码:https://github.com/OPPO-PersonalAI/Flash-Searcher

一、为什么我们要做 Flash-Searcher?

当下的 Web 智能体(Agent)在解决复杂研究任务时,大多沿用传统的顺序执行链(Sequential Chain):每个子任务依次调用检索、解析、总结等工具。这种方式虽然直观,但在复杂场景中存在两个根本性问题:

  • 执行效率低:每一步都必须等待上一步完成,冗余时间极高;

  • 信息利用率低:各个子任务之间无法并行,工具调用缺乏依赖建模;

尤其是在多工具、多阶段任务(如 Deep Research)中,串行执行会造成指数级延迟,甚至数十步以上的交互才能完成一次查询。于是我们提出了Flash-Searcher:一个以DAG(有向无环图)并行执行机制为核心的全新 Agent 框架,通过结构化并行与动态调度,让智能体可以像多线程程序一样同时思考、同时执行

二、方法概览:从顺序链到 DAG 并行

Flash-Searcher 将任务从单一的线性链拆分为多组具备依赖关系的子任务节点,用类似 DAG 结构来描述任务之间的约束。当DAG关系确定时,Flash-Searcher在单次推理中并行调度所有的分支,同步运行,同时在存在依赖的关系的节点时,通过不同的分支执行情况交叉验证,以显著提高任务成功率。

这一机制使得智能体在保持逻辑一致性的前提下,显著提升执行吞吐与速度。此外,我们引入了两项关键机制:

  1. 动态执行流优化(Dynamic Workflow Optimization): 系统会根据中间结果动态更新 DAG 结构,更新已完成节点、重估依赖、按需细化新子任务。 这让智能体能持续优化自己的执行计划,而非被固定链条束缚。

  2. 任务进展总结与信息共享(Summarization & Knowledge Sharing): 定期对任务执行情况进行总结,更新和分析当前执行进展;同时通过进展总结可通过对话截断实现上下文长度扩展,保证已有知识和任务执行情况共享,进一步提高任务解决成功率。

三、核心算法结构

四、实验设置与评测基准

我们在四个高难度的检索-推理基准上系统验证了 Flash-Searcher 的性能:

工具配置上,Flash-Searcher 使用轻量级的 Search(Serper)+ Crawl(Jina Reader)双工具体系,并以同一模型执行自动化总结,从而在并行场景下保持一致的语义表示。所有任务均通过 GPT-4.1-mini 作为评判器(LLM-as-Judge),以Pass@1指标计算准确率,同时记录执行步数与总时延。

五、核心结果:性能 × 效率双突破

Flash-Searcher 在所有主要基准上均刷新或逼近现有最优水平:

此外,Flash-Searcher 平均减少35% 的执行步骤(例如 11.2 → 7.4),在相同硬件条件下整体时延降低约 65%。

这意味着 Flash-Searcher 不仅“更快”,而且“更聪明地并行思考”。

六、从框架到模型:并行推理的蒸馏(Distillation)

在框架层验证之后,我们进一步将并行执行轨迹蒸馏到单模型中。通过轻量级监督微调(无需强化学习或复杂工具调用),即便是 Qwen-2.5-32B 这样的开源骨干模型,也能显著提升:

  • xBench-DeepSearch:提升至68.0(比 WebDancer 高 +29.3)

  • 模型从 32B 扩展到 72B 时,性能仍稳定上升

  • 说明“并行推理”是一种可学习的结构性偏置,可迁移到不同架构与规模的模型中

七、与现有工作的区别

  • 相比多智能体系统(MAS):Flash-Searcher 在单框架中实现角色分工与并行调度, 避免多 Agent 间冗余通信导致的串行化开销。

  • 相比工具集成推理(TIR):我们先以 DAG 明确结构依赖,再通过蒸馏将并行策略迁移进单模型, 在通用性与可解释性之间取得更好平衡。

九、结论与展望

Flash-Searcher 通过DAG 并行执行 + 动态优化 + 信息共享,为 Web 智能体提供了一个更高效、更可扩展的执行范式。

  • 在 BrowseComp、xBench、GAIA、HLE 等基准上全面领先;

  • 平均减少 35% 步数、时延下降 65%;

  • 并行推理可迁移、可蒸馏,为高效智能体提供结构归纳偏置。

我们认为,这一范式将成为下一代 Web Agent 的底层执行标准。

十、开源与资源

我们已将论文发布在 arXiv(https://arxiv.org/abs/2509.25301)

代码也已经开源:https://github.com/OPPO-PersonalAI/Flash-Searcher

后续也将陆续开源并行轨迹数据集

💬 互动区常见问题

Q1:并行执行会不会牺牲正确性?

不会。Flash-Searcher 的依赖建模与动态重整机制保证逻辑一致性,通过获取更多的知识实现交叉验证的效果,实际准确率反而更高。

Q2:能在已有链式 Agent 上复用吗?

可以。只需把“计划-执行-校验”映射为 DAG 节点与依赖关系,并行化推动任务进展即可。

Q3:与 Kimi DeepResearch / OpenAI DeepResearch 的关系?

在 BrowseComp、xBench 上,Flash-Searcher 的性能已与后者相当甚至略优,但实现方式完全开放、结构可解释、易于迁移到开源生态。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/18 6:24:36

E-Hentai资源批量获取工具技术解析

E-Hentai资源批量获取工具技术解析 【免费下载链接】E-Hentai-Downloader Download E-Hentai archive as zip file 项目地址: https://gitcode.com/gh_mirrors/eh/E-Hentai-Downloader 核心价值 作为一款专注于资源获取与批量内容管理的浏览器用户脚本,E-He…

作者头像 李华
网站建设 2026/4/18 5:01:18

微信数据恢复与本地解密安全操作指南

微信数据恢复与本地解密安全操作指南 【免费下载链接】WechatDecrypt 微信消息解密工具 项目地址: https://gitcode.com/gh_mirrors/we/WechatDecrypt 您是否曾经为误删重要微信聊天记录而焦虑?是否担心在线解密工具带来的数据泄露风险?现在&…

作者头像 李华
网站建设 2026/4/18 5:24:49

深入解析IR红外遥控协议:从NEC编码到STM32实现

1. 红外遥控技术基础:从灯泡到数字信号 你可能不知道,每天你至少会使用3次红外遥控技术——当你用电视遥控器换台、用空调遥控器调节温度,甚至用某些智能家居设备控制灯光时。这种诞生于20世纪70年代的技术,至今仍是家电控制领域的…

作者头像 李华
网站建设 2026/3/31 19:11:14

3招驯服Ryzen猛兽:SMUDebugTool硬件调试从入门到封神

3招驯服Ryzen猛兽:SMUDebugTool硬件调试从入门到封神 【免费下载链接】SMUDebugTool A dedicated tool to help write/read various parameters of Ryzen-based systems, such as manual overclock, SMU, PCI, CPUID, MSR and Power Table. 项目地址: https://git…

作者头像 李华
网站建设 2026/4/18 5:26:04

PPTTimer:演讲时间管理的终极解决方案

PPTTimer:演讲时间管理的终极解决方案 【免费下载链接】ppttimer 一个简易的 PPT 计时器 项目地址: https://gitcode.com/gh_mirrors/pp/ppttimer 在演讲领域,精准的时间控制是区分普通演讲者与专业演讲者的关键标志。PPTTimer作为一款专为演讲场…

作者头像 李华
网站建设 2026/4/18 5:20:38

茉莉花插件:提升中文文献智能管理效率的技术突破方案

茉莉花插件:提升中文文献智能管理效率的技术突破方案 【免费下载链接】jasminum A Zotero add-on to retrive CNKI meta data. 一个简单的Zotero 插件,用于识别中文元数据 项目地址: https://gitcode.com/gh_mirrors/ja/jasminum 在学术研究领域&…

作者头像 李华