news 2026/4/17 22:54:04

SentGraph:大模型多跳问答的终极解决方案,降低token消耗69%的秘诀

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
SentGraph:大模型多跳问答的终极解决方案,降低token消耗69%的秘诀

文章介绍SentGraph框架,一种基于句子级图谱的检索增强生成方法,通过修辞结构理论建模句子间细粒度逻辑关系,构建层次化句子图谱解决多跳问答问题。实验证明,该方法在降低69%输入token消耗的同时显著提升问答准确性,为知识密集型应用提供了高效解决方案。


文章摘要

本文提出SentGraph框架,一种基于句子级图谱的检索增强生成方法,专门用于解决多跳问答任务。通过引入修辞结构理论(RST)建模句子间细粒度逻辑关系,构建层次化句子图谱,实现精准的证据检索。实验表明,该方法在降低69%输入token消耗的同时,显著提升了多跳问答准确性。


一、研究背景:传统RAG系统的困境

1.1 大语言模型的局限性

大语言模型(LLMs)在语义理解和文本生成方面展现出强大能力,在文档阅读理解任务中显示出广阔的应用潜力。然而,LLMs仍然受限于其内部知识边界,并且容易产生幻觉(hallucination),特别是在需要严格事实准确性的场景中。

1.2 检索增强生成(RAG)的挑战

为了解决这些问题,检索增强生成(RAG)技术通过整合外部知识来支持LLM生成。传统的RAG系统在单跳问答中表现良好,但在多跳问答任务中面临重大局限。

传统方法的三大痛点:

  1. 基于块(chunk)的检索提供不相关的上下文

    :现有的分块检索常常返回逻辑不连贯的内容,导致证据链不完整

  2. 迭代检索的高延迟问题

    :虽然迭代检索可以扩大证据覆盖范围,但反复的检索过程引入了显著的计算开销和延迟,限制了实时应用场景的适用性

  3. 粗粒度图谱的表达能力不足

    :现有的基于图的方法通常依赖于块级别的相似性连接,难以捕捉核心句子之间细粒度的语义和逻辑关系


二、SentGraph框架:创新性解决方案

2.1 核心设计理念

SentGraph的基本思路是提出一种基于句子图谱的检索增强生成方法。具体而言,研究团队尝试将检索粒度从块降低到单个句子,并使用显式的方式对句子之间的语义和逻辑关系进行建模。

SentGraph是一个句子级逻辑图谱构建和检索增强生成框架,专门用于多跳问答。它突破了传统的基于块的检索和建模范式,通过显式捕捉文档内部和跨文档的句子级逻辑依赖关系,实现了更细粒度的知识组织和推理路径建模。

2.2 框架总体架构

如图2所示,该框架包含两个阶段:离线句子逻辑图谱构建在线基于图的检索与答案生成

离线阶段:通过建模句子级逻辑结构构建层次化句子逻辑图谱
在线阶段:基于图谱执行证据检索和答案生成,从而提高LLMs在复杂问题上的跨文档推理效果


三、技术创新:层次化句子图谱构建

3.1 引入修辞结构理论(RST)

为了解决上下文丢失和关系建模复杂性的问题,SentGraph采用了基于修辞结构理论(RST)的精炼逻辑关系集。研究团队通过整合频繁出现的关系并移除罕见关系,形成了一个实用的关系分类体系,该体系自然地区分了核心句子(nucleus sentences)和附属句子(satellite sentences)。

3.2 双重逻辑关系建模

核心-核心(N-N)关系:建模具有同等重要性的句子之间的逻辑连接,这些句子共同传达核心文档语义,包括:

  • 连接(conjunction)
  • 对比(contrast)
  • 析取(disjunction)
  • 多核重述(multinuclear restatement)
  • 序列(sequence)关系

核心-附属(N-S)关系:建模核心句子与其支撑句子之间的非对称依赖关系,包括:

  • 因果(cause)
  • 结果(result)
  • 对立(opposition)
  • 详述(elaboration)
  • 情境(circumstance)
  • 评价(evaluation)
  • 解决方案(solutionhood)关系

3.3 三层图谱结构设计

为了应对高计算开销的挑战,SentGraph设计了一个三层图结构,包括主题层、核心句子层和补充句子层。

图谱形式化定义为:G = (V, E)

节点集合:V = Vt ∪ Vc ∪ Vs

  • 主题节点(Vt)

    :代表文档级语义摘要,用于跨文档桥接

  • 核心句子节点(Vc)

    :对应承载关键事实和推理支持的句子

  • 补充句子节点(Vs)

    :代表详述或条件性补充核心句子的从属句子

边集合:E = Ett ∪ Etc ∪ Ecc ∪ Ecs

该结构通过层次化组织平衡了表达能力和计算复杂性,避免了直接构建全局句子图谱的计算开销。

3.4 跨文档连接策略

研究团队没有构建密集的全局句子图谱,而是首先在单个文档内构建主题级子图,然后通过主题层的实体-概念桥梁建立跨文档连接。这种设计显著降低了计算复杂度,同时保持了跨文档推理能力。


四、在线检索策略:图引导的证据选择

4.1 锚点选择与细化

在在线检索阶段,SentGraph引入了基于句子图谱的检索增强生成策略,实现细粒度的证据选择。系统首先根据用户查询嵌入(Query Embedding)进行锚点选择与细化。

4.2 路径扩展机制

通过图结构的路径扩展,系统能够检索关键证据句子及其逻辑上下文,用于多跳问答任务。这种机制确保了:

  • 检索到的证据句子之间具有明确的逻辑关系
  • 避免了传统块级检索中常见的不相关上下文
  • 保持了完整的推理链条

4.3 实际应用案例

以原文中的示例问题为例:
问题:“When did the country that has the same co-official language as that of the movie about the city where Petar Trifunović died send an independent team to the Olympics?”

证据句子

  • S1: Dr. Petar Trifunović (31 August 1910, Dubrovnik – 8…
  • S2: … It is the official language of Serbia …
  • S3: … national team at the 2016 Summer Olympics.

答案:2016

通过图谱的引导,系统能够准确检索到这三个关键证据句子,并建立它们之间的逻辑关联,最终得出正确答案。


五、实验验证:显著的性能提升

5.1 多维度性能提升

研究团队在四个多跳问答基准数据集上进行了广泛实验,结果证明了SentGraph的有效性,验证了显式建模句子级逻辑依赖关系的重要性。

5.2 Token消耗大幅降低

SentGraph在保持甚至提高准确性的同时,实现了显著的token消耗降低:

输入token节省

  • 通过句子级检索而非段落级检索,实现了更细粒度的证据选择
  • 减少了传统段落级检索中经常包含的不相关上下文

输出token节省更为显著

  • HotpotQA:减少69.00%
  • 2WikiMultiHopQA:减少18.56%
  • MuSiQue:减少9.22%

这表明更清晰的输入证据导致了更简洁和聚焦的生成结果。

5.3 准确性与效率的双重优化

结合性能改进结果,这些数据表明SentGraph以更低的计算成本实现了更好的准确性。这种效率提升对于实际部署和大规模应用具有重要意义。


六、方法论贡献与创新价值

6.1 理论创新

SentGraph团队首次将修辞结构理论(RST)应用于句子级图谱构建,用于检索增强生成,为建模句子之间的细粒度逻辑关系提供了一种有原则的方法。

6.2 技术创新

提出了一种离线层次化句子图谱构建方法,具有双重逻辑关系建模能力,同时配备了在线句子级检索策略,该策略利用图结构为多跳问答任务检索关键证据句子及其逻辑上下文。

6.3 实践价值

对于企事业单位和科研院所而言,SentGraph的价值体现在:

  1. 知识管理优化

    :通过细粒度的句子级知识组织,提升企业知识库的管理效率

  2. 智能问答系统升级

    :显著提高需要跨文档推理的复杂问答系统性能

  3. 成本效益提升

    :大幅降低token消耗,减少API调用成本

  4. 实时应用可行性

    :通过离线图谱构建降低在线推理延迟,使实时应用成为可能


七、未来展望与应用前景

7.1 技术演进方向

SentGraph为多跳问答任务中的细粒度逻辑依赖建模开辟了新方向。未来的研究可以探索:

  • 更复杂的跨模态推理任务
  • 动态图谱更新机制
  • 与其他知识表示方法的融合

7.2 产业应用场景

科研领域:文献综述自动化、科研问答系统、知识发现平台

企业应用:智能客服升级、企业知识管理、决策支持系统

金融投资:多源信息整合分析、投资研究报告生成、风险评估系统

7.3 投资价值分析

从投资角度看,SentGraph代表的技术方向具有:

  • 技术壁垒高

    :独特的RST应用和层次化图谱设计

  • 成本优势明显

    :显著的token消耗降低直接转化为运营成本节省

  • 市场需求旺盛

    :企业级智能问答系统市场快速增长

  • 可扩展性强

    :适用于多种垂直领域的知识密集型应用


八、总结

SentGraph提出了一个句子级基于图的RAG框架,用于多跳问答任务。该框架通过适配RST构建具有显式逻辑依赖关系的层次化句子图谱,并采用图引导的检索策略在句子级别实现细粒度证据选择。

广泛的实验表明,SentGraph在降低token消耗的同时实现了一致的性能改进,突出了细粒度逻辑依赖建模对于有效多跳问答的重要性。

对于专业人群而言,这项研究不仅提供了技术创新,更重要的是展示了如何通过精细化的知识建模和检索策略,在保证准确性的同时大幅提升系统效率,为企业级AI应用的实际部署提供了可行路径。

​最后

我在一线科技企业深耕十二载,见证过太多因技术更迭而跃迁的案例。那些率先拥抱 AI 的同事,早已在效率与薪资上形成代际优势,我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在大模型的学习中的很多困惑。

我整理出这套 AI 大模型突围资料包:

  • ✅AI大模型学习路线图
  • ✅Agent行业报告
  • ✅100集大模型视频教程
  • ✅大模型书籍PDF
  • ✅DeepSeek教程
  • ✅AI产品经理入门资料

完整的大模型学习和面试资料已经上传带到CSDN的官方了,有需要的朋友可以扫描下方二维码免费领取【保证100%免费】👇👇
​​

为什么说现在普通人就业/升职加薪的首选是AI大模型?

人工智能技术的爆发式增长,正以不可逆转之势重塑就业市场版图。从DeepSeek等国产大模型引发的科技圈热议,到全国两会关于AI产业发展的政策聚焦,再到招聘会上排起的长队,AI的热度已从技术领域渗透到就业市场的每一个角落。


智联招聘的最新数据给出了最直观的印证:2025年2月,AI领域求职人数同比增幅突破200%,远超其他行业平均水平;整个人工智能行业的求职增速达到33.4%,位居各行业榜首,其中人工智能工程师岗位的求职热度更是飙升69.6%。

AI产业的快速扩张,也让人才供需矛盾愈发突出。麦肯锡报告明确预测,到2030年中国AI专业人才需求将达600万人,人才缺口可能高达400万人,这一缺口不仅存在于核心技术领域,更蔓延至产业应用的各个环节。

​​

资料包有什么?

①从入门到精通的全套视频教程⑤⑥

包含提示词工程、RAG、Agent等技术点

② AI大模型学习路线图(还有视频解说)

全过程AI大模型学习路线

③学习电子书籍和技术文档

市面上的大模型书籍确实太多了,这些是我精选出来的

④各大厂大模型面试题目详解

⑤ 这些资料真的有用吗?

这份资料由我和鲁为民博士共同整理,鲁为民博士先后获得了北京清华大学学士和美国加州理工学院博士学位,在包括IEEE Transactions等学术期刊和诸多国际会议上发表了超过50篇学术论文、取得了多项美国和中国发明专利,同时还斩获了吴文俊人工智能科学技术奖。目前我正在和鲁博士共同进行人工智能的研究。

所有的视频教程由智泊AI老师录制,且资料与智泊AI共享,相互补充。这份学习大礼包应该算是现在最全面的大模型学习资料了。

资料内容涵盖了从入门到进阶的各类视频教程和实战项目,无论你是小白还是有些技术基础的,这份资料都绝对能帮助你提升薪资待遇,转行大模型岗位。


智泊AI始终秉持着“让每个人平等享受到优质教育资源”的育人理念‌,通过动态追踪大模型开发、数据标注伦理等前沿技术趋势‌,构建起"前沿课程+智能实训+精准就业"的高效培养体系。

课堂上不光教理论,还带着学员做了十多个真实项目。学员要亲自上手搞数据清洗、模型调优这些硬核操作,把课本知识变成真本事‌!

​​​​

如果说你是以下人群中的其中一类,都可以来智泊AI学习人工智能,找到高薪工作,一次小小的“投资”换来的是终身受益!

应届毕业生‌:无工作经验但想要系统学习AI大模型技术,期待通过实战项目掌握核心技术。

零基础转型‌:非技术背景但关注AI应用场景,计划通过低代码工具实现“AI+行业”跨界‌。

业务赋能 ‌突破瓶颈:传统开发者(Java/前端等)学习Transformer架构与LangChain框架,向AI全栈工程师转型‌。

👉获取方式:

😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓**

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/18 3:59:18

AI产品经理核心能力图谱:不只是写Prompt,这些能力才是关键!

文章解析了AI产品经理与传统产品经理的本质区别,阐述了三大职责(需求定义、跨域协同、效果迭代)和四大核心能力(技术理解力、业务洞察力、数据敏感度、风险把控力)。AI产品经理不是简单会写Prompt,而是需要…

作者头像 李华
网站建设 2026/4/18 4:05:02

物种分布曲线的五个矩

物种分布曲线的五个矩 引言 正文 第一个矩:均值(一阶矩) 第二个矩:方差 σ 2 \sigma^2 σ2 (二阶中心矩) 第三个矩:偏度(Skewness,三阶标准化矩) 第四个矩:峰度(Kurtosis,四阶标准化矩) 第五个矩:五阶矩(Hyperskewness / Tail asymmetry) 绘图代码 Author: JiJi …

作者头像 李华
网站建设 2026/4/18 8:47:09

【PMP】风险管理

一、风险基础核心概念 1. 风险本质与管理流程 定义:未来可能发生的、影响项目目标(范围/进度/成本/质量)的不确定事件(含威胁和机会)。核心流程(必记):识别风险 → 定性风险分析 → …

作者头像 李华
网站建设 2026/4/18 8:51:51

法尔斯新闻社1398年波斯语新闻数据集_29万条_多领域分类_完整文本内容_自然语言处理_文本挖掘_机器学习训练数据

法尔斯新闻社1398年波斯语新闻数据集 引言与背景 法尔斯新闻社1398年波斯语新闻数据集是一个大规模、高质量的波斯语新闻文本数据集,收录了法尔斯新闻社在1398年(即2019-2020年)期间发布的全部新闻文章。该数据集包含294,023条新闻记录&#…

作者头像 李华
网站建设 2026/4/18 8:48:29

咕噜分发——APP图标在线制作

咕噜分发(gulufenfa.com)的APP图标在线制作工具是该平台提供的一项实用功能,主要面向APP开发者、测试人员及企业用户,用于快速生成符合iOS/Android平台规范的APP图标资源包。以下是该功能的详细介绍: 一、功能定位与核…

作者头像 李华