news 2026/4/18 14:32:43

从 SAS 到 MAS:构建高效、可扩展的 AI Agent 架构演进

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
从 SAS 到 MAS:构建高效、可扩展的 AI Agent 架构演进

本文基于Building Conversation Kernels for AI Agents中的核心示意图与文字内容,总结当前主流 Agent 架构的演进路径,并结合图示拆解其设计动机、优缺点与适用场景。


一、背景:为什么需要新的 Agent 架构?

随着 AI Agent 从单轮问答演进到复杂、多轮、工具驱动任务,传统的Single Agent System(SAS)暴露出明显问题:

  • 上下文无限膨胀(Context Pollution)
  • 工具与指令耦合严重
  • 长对话下性能与稳定性下降
  • 复杂任务难以扩展

为了解决这些问题,Agent 架构逐步从单体 → 分工 → 编排 → 群体演进。


二、On-Demand Tooling SAS:按需加载技能的单体 Agent

1. 核心思想

在传统 SAS 的基础上,引入Skill(技能)概念:

  • 技能以独立SKILL.md形式存在
  • 描述:功能、输入输出、可用工具
  • Agent 在运行时按需学习并注入技能

skill参考地址

2. Agent 调用关系(泳道图)

关键点:Skill 一旦加载即进入长期上下文,形成不可逆增长

ToolsSkill LoaderSingle Agent (SAS)UserToolsSkill LoaderSingle Agent (SAS)User用户请求按需加载 SkillSkill 描述 和 Tool Schema调用工具工具结果回复结果

3. 优点

  • 比静态工具集更灵活
  • 技能模块化、可复用
  • 降低初始上下文负担

4. 致命问题

上下文不可逆增长(Irreversible Context Growth)

  • 技能一旦注入,为保持一致性就难以移除
  • 长会话后仍会走向 Context Pollution
  • 本质仍是“增强版单体 Agent”

📌结论:这是过渡方案,而非终局。


三、Context Engineer / Executor SAS:双模型串行架构

1. 架构拆分

角色模型职责
Context Engineer小模型(Fast / SFT)上下文工程、Query Rewrite、RAG、工具筛选
Executor大模型(Reasoning)在“干净上下文”中执行 ReAct

2. Agent 调用关系(泳道图)

关键点:Context Engineer 决定“给什么”,Executor 决定“怎么做”

ToolsExecutorRAG / DocsContext EngineerUserToolsExecutorRAG / DocsContext EngineerUser用户问题检索 / Query Rewrite相关文档精炼 Context + Tool Schema调用工具工具结果最终回答

3. 优点

  • 高效率:小模型做“脏活累活”
  • 上下文干净:Executor 不被污染
  • 成本可控

4. 局限

  • 工具依赖 SFT,扩展成本高
  • Context Engineer 判断错误会被放大
  • 系统运维复杂(双模型)

📌结论:工程效率很高,但灵活性不足。


四、Multi-Agent System(MAS):多 Agent 分工协作

MAS 是当前主流与未来趋势,核心思想只有一句话:

让不同 Agent 各司其职,而不是让一个 Agent 无所不能


1、Basic Centralized MAS:Dialog / Planner 双 Agent

1.1 角色划分
  • Dialog Agent

    • 与用户交互
    • 维护长期、干净记忆
  • Planner Agent

    • 接收 Task Specification
    • 规划步骤、调用工具
1.2 Agent 调用关系(泳道图)

关键点:Dialog 不碰工具,Planner 不直接对话

ToolsPlanner AgentDialog AgentUserToolsPlanner AgentDialog AgentUser用户输入Task Specification执行计划 / 调用工具执行结果Final Result用户可读回复
1. 3 记忆策略
Agent记忆特征
Dialog长期、精简(只保留最终结果)
Planner短期、深度(完整执行链路)
1.4 优点
  • 指令竞争问题消失
  • 支持长期对话
  • 性能更稳定
1.5 缺点
  • 单轮任务延迟略高

  • 信息传递存在损耗

  • Planner 成为瓶颈

  • 单轮任务延迟略高

  • 信息传递存在损耗

  • Planner 成为瓶颈


2、Hierarchical Centralized MAS:层级化 Agent 组织

2.1 类似“公司组织结构”
  • Dialog Agent(前台)
  • Primary Planner(老板)
  • Team Leader(部门负责人)
  • Worker Agent(执行者)
2.2 Agent 调用关系(泳道图)

关键点:任务逐层拆解,结果逐层回传

Worker AgentTeam LeaderPrimary PlannerDialog AgentUserWorker AgentTeam LeaderPrimary PlannerDialog AgentUser复杂任务请求高层 Task Spec子任务分解执行指令执行结果子任务完成汇总结果最终回复
2.3 适用场景
  • 超复杂任务(写书、市场调研)
  • 长时间异步执行
2.4 核心问题
  • 延迟高

  • 调试极难(电话游戏效应)

  • 只适合高价值任务

  • 延迟高

  • 调试极难(电话游戏效应)

  • 只适合高价值任务


3、Orchestrator MAS:编排者中心架构(强烈推荐)

3.1 核心角色
  • Orchestrator Agent

    • 全局状态机
    • 路由、调度、聚合结果
  • Specialized Planner

    • 只做规划(Coding / Writing / Math)
  • Executor Agent

    • 具备重试、容错能力的“智能工具”
3.2 Agent 调用关系(泳道图)

关键点:Orchestrator 统一决策,Planner 与 Executor 完全解耦

Executor AgentSpecialized PlannerOrchestratorDialog AgentUserExecutor AgentSpecialized PlannerOrchestratorDialog AgentUser用户请求Task Specification请求领域规划执行计划下发执行指令执行结果 / 重试聚合结果最终回复
3.3 优点
  • Planner 可独立优化(CoT-SC / Critic)
  • 扩展安全,不影响全局
  • Executor 更稳定

3.4 核心挑战

  • 规划与执行可能脱节
  • Orchestrator 本身要“足够聪明”

📌结论:这是当前工程实践中最平衡的 MAS 架构


4️⃣ 一个重要对比总结

架构决策权执行权上下文控制
SAS单 Agent单 Agent
Context/ExecutorContext EngineerExecutor
Basic MASPlannerPlanner很好
Orchestrator MASOrchestratorExecutor Agent⭐⭐⭐⭐⭐

五、总结:架构选型建议

场景推荐架构
简单问答基础 SAS
工具密集Context Engineer + Executor
长对话Basic MAS
超复杂任务Hierarchical MAS
通用 AI Agent 平台Orchestrator MAS⭐⭐⭐⭐⭐

Agent 架构的本质,不是模型有多强,而是“谁在什么时候,知道什么,能做什么”。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/17 18:11:05

细胞多尺度仿真软件:MCell_(4).MCell的用户界面与基本操作

MCell的用户界面与基本操作 用户界面概述 MCell 是一个用于细胞多尺度仿真的软件,其用户界面设计旨在为用户提供直观、高效的操作体验。MCell 的用户界面主要包括以下几个部分:主窗口:显示主要的仿真结果和控制面板。控制台:用于输…

作者头像 李华
网站建设 2026/4/18 11:55:07

探索大数据领域 Hadoop 的分布式存储奥秘

探索Hadoop分布式存储奥秘:从原理到实践的深度解析 副标题:揭秘HDFS的设计哲学与工程实现 摘要/引言 当你需要处理10TB的日志文件、训练100GB的机器学习模型,或者存储PB级的用户行为数据时,传统单机存储会立刻暴露三大痛点: 容量瓶颈:单机硬盘最多几个TB,根本装不下P…

作者头像 李华
网站建设 2026/4/18 5:38:17

【小程序毕设源码分享】基于springboot+Android的多功能智能手机阅读APP的设计与实现(程序+文档+代码讲解+一条龙定制)

博主介绍:✌️码农一枚 ,专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围:&am…

作者头像 李华
网站建设 2026/4/18 7:52:50

Base64 编码详解:原理、用途与实现

在计算机系统和网络通信中,我们经常需要在只支持文本的环境中传输或存储二进制数据。例如,电子邮件协议、HTML 文档、JSON 接口等场景通常仅能安全处理可打印的 ASCII 字符。为了解决这一限制,Base64 编码应运而生。本文将深入介绍 Base64 的基本原理、编码规则、典型应用场…

作者头像 李华
网站建设 2026/4/18 8:18:24

数据湖与数据仓库的溯源技术差异解析

数据湖与数据仓库的溯源技术差异解析 关键词:数据湖、数据仓库、数据溯源、元数据管理、血缘分析、数据治理、数据架构 摘要:本文以“数据溯源”为核心,深入解析数据湖与数据仓库在溯源技术上的本质差异。通过生活场景类比、技术原理拆解、代…

作者头像 李华