news 2026/4/17 13:57:50

Agent-as-a-Graph:大模型多智能体系统工具与智能体精准检索新范式

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
Agent-as-a-Graph:大模型多智能体系统工具与智能体精准检索新范式

本文提出Agent-as-a-Graph方法,将智能体和工具作为平等节点构建二分图知识图谱,解决多智能体系统中精准检索痛点。通过向量初筛、类型加权RRF融合和图遍历聚合三步流程,Recall@5提升18.6%,且不依赖特定Embedding模型,具有跨模型泛化能力强、可手动调优等优势,显著提升检索效率和准确性。


当前大语言模型多智能体系统面临的一个核心痛点:如何在成千上万个工具和智能体中,精准找到最适合当前任务的那一个?

  • Agent-Only检索(智能体导向)智能体描述往往无法覆盖其工具库的全部能力。
  • Tool-Only检索(工具导向)把每个工具当作独立个体。这忽略了工具间的协同效应

Figure 1: 传统方法与Agent-as-Graph对比

传统方法要么只能看到"智能体层面",要么只能看到"工具层面",无法在统一空间中进行权衡。

💡 二、把智能体和工具都变成图谱节点

核心思想:Agent-as-a-Graph

研究团队的天才之处在于:不再把智能体和工具看作两个独立层级,而是将它们作为平等节点放入知识图谱

整个系统被建模为一个**二分图 G = (Agents, Tools, Edges)**:

  • 智能体节点(𝒜):包含智能体名称和描述
  • 工具节点(𝒯):包含工具名称和描述
  • 所有权边(E):明确连接每个工具到其父智能体

这种方法一举三得:

  1. 细粒度匹配:工具节点保留了具体功能描述
  2. 上下文保留:通过图遍历总能回到父智能体
  3. 统一检索:在同一个向量空间中对齐两种节点

三步检索流程(Algorithm 1)

Algorithm 1: Agent-as-a-Graph检索算法

第一步:向量初筛对查询q,从工具库𝒞ₜ和智能体库𝒞ₐ中分别检索Top-N候选(N ≫ K),得到两个初始列表。

第二步:类型加权RRF融合这是论文的神来之笔!传统RRF对所有结果一视同仁,但论文提出按节点类型加权的RRF(wRRF)

α(工具节点)α(智能体节点)

其中α_𝒜和α_𝒯是两个可解释旋钮,允许你手动调优智能体覆盖度与工具精度的平衡!这种方式既保留了RRF的鲁棒性,又引入了对异构节点的灵活控制。

第三步:图遍历聚合从融合后的列表中逐个取出节点,如果是工具则通过owner(e)函数找到其父智能体,最终聚合出Top-K个可执行智能体。

📊 三、效果显著且架构通用

基准测试结果(Table 1)

Table 1: LiveMCPBench基准对比

使用OpenAI text-embedding-ada-002模型的结果显示:

  • Recall@5达到0.83,比之前的SOTA(MCPZero)提升18.6%
  • nDCG@5达到0.46,显著高于其他基线
  • 超过39%的检索结果来自智能体节点,34%通过工具边追溯获得,证明两类节点都不可或缺

跨模型泛化能力(Table 2)

Table 2: 不同嵌入模型的性能对比

最令人振奋的是,这个方案不挑Embedding模型!在8种完全不同的嵌入架构上测试(从谷歌Vertex AI、亚马逊Titan到OpenAI和开源的All-MiniLM-L6-v2):

  • 平均Recall@5:0.85 vs 0.70(提升19.4%)
  • 标准差仅0.02,性能波动极小
  • 甚至在小模型All-MiniLM-L6-v2上也提升了19.4%

这说明改进来自图谱结构本身,而非特定向量表示,对生产部署极其友好!

类型权重调优(Figure 2 & Table 3)

Table 3: 加权RRF配置对比

Figure 2: 不同类型权重配置的性能曲线

通过网格搜索发现:

  • 最优比例:α_𝒜:α_𝒯 = 1.5:1(智能体权重稍高)
  • 极端偏向会损害性能(3:1智能体偏重导致Recall降至0.76)
  • 相比标准加权RRF,类型特定权重设计额外提升2.41%

这种可解释、可手动调优的特性,让运维人员能根据领域特点灵活调整,无需重新训练模型。

如何学习AI大模型?

如果你对AI大模型入门感兴趣,那么你需要的话可以点击这里大模型重磅福利:入门进阶全套104G学习资源包免费分享!

这份完整版的大模型 AI 学习和面试资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

这是一份大模型从零基础到进阶的学习路线大纲全览,小伙伴们记得点个收藏!


第一阶段:从大模型系统设计入手,讲解大模型的主要方法;

第二阶段:在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用;

第三阶段:大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统;

第四阶段:大模型知识库应用开发以LangChain框架为例,构建物流行业咨询智能问答系统;

第五阶段:大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型;

第六阶段:以SD多模态大模型为主,搭建了文生图小程序案例;

第七阶段:以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。

100套AI大模型商业化落地方案

大模型全套视频教程

200本大模型PDF书籍

👉学会后的收获:👈

• 基于大模型全栈工程实现(前端、后端、产品经理、设计、数据分析等),通过这门课可获得不同能力;

• 能够利用大模型解决相关实际项目需求: 大数据时代,越来越多的企业和机构需要处理海量数据,利用大模型技术可以更好地处理这些数据,提高数据分析和决策的准确性。因此,掌握大模型应用开发技能,可以让程序员更好地应对实际项目需求;

• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;

• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。

LLM面试题合集

大模型产品经理资源合集

大模型项目实战合集

👉获取方式:
😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/18 3:31:32

【计算机毕设】Python高校社团学生会管理系统

💟博主:程序员小俊:CSDN作者、博客专家、全栈领域优质创作者 💟专注于计算机毕业设计,大数据、深度学习、Java、小程序、python、安卓等技术领域 📲文章末尾获取源码数据库 🌈还有大家在毕设选题…

作者头像 李华
网站建设 2026/4/18 3:27:19

大模型RAG技术完全指南:是什么+三种形态+实战案例,建议收藏!

RAG 核心认知:是什么、有哪些形态 什么是RAG 简单说,RAG(检索增强生成)就是给 AI 模型装了一个 “专属知识库 精准搜索引擎”。AI 在回答问题时,只基于你提供的真实知识(比如公司文档、专业资料、实时数据…

作者头像 李华
网站建设 2026/4/18 8:51:11

深入理解网络分层模型:数据封包与解包全解析

深入理解网络分层模型:数据封包与解包全解析引言:网络通信的"洋葱模型"一、网络分层模型概述1.1 OSI七层模型 vs TCP/IP四层模型二、数据封包过程详解2.1 应用层封包2.2 传输层封包(以TCP为例)2.3 网络层封包&#xff0…

作者头像 李华
网站建设 2026/4/18 8:32:03

Java面试场景:深入探讨Spring Boot与微服务架构应用

Java面试场景:深入探讨Spring Boot与微服务架构应用 场景描述 在一家互联网大厂的面试场景中,小白程序员“超好吃”面试Java开发岗位。面试官是一位严肃但不失温和的技术专家,整个面试过程由三轮提问组成,涉及Spring Boot、微服务…

作者头像 李华
网站建设 2026/4/18 5:08:37

35岁程序员必看!大模型转型全攻略+学习资源,收藏这篇就够了!

35岁程序员面临职业转型十字路口时,大模型作为当下最热门的技术赛道,无疑是极具吸引力的选择。但跨领域转型并非易事,需要系统规划与稳步推进。以下是专为35岁程序员量身定制的大模型领域转行落地步骤,兼顾基础入门与技能衔接&…

作者头像 李华
网站建设 2026/4/18 5:07:56

转行大模型开发必备:知识体系、能力要求与实战指南,非常详细收藏我这一篇就够了

本文详细解析转行大模型开发所需的知识体系与学习路径,涵盖编程语言、数学基础、机器学习、NLP等核心技能,并从入门到专业阶段规划了技术路线。通过明确各项技术的掌握程度,结合医疗行业应用案例和岗位需求数据,为转行者提供系统性…

作者头像 李华