news 2026/4/18 10:29:56

【RAG召回排序】2025最全排序模型梳理

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
【RAG召回排序】2025最全排序模型梳理

2025年检索重排模型全景盘点:从顶尖榜单到实用工具

在检索增强生成(RAG)和智能搜索领域,检索与重排模型的性能直接决定了系统的最终效果。今天我们就从权威排行榜出发,盘点当前最受关注的模型与工具。


一、权威检索重排排行榜速览

目前业内最受关注的两大检索重排模型排行榜分别是:

  • BGE-Reasoner 榜单(https://github.com/VectorSpaceLab/agentic-search/tree/main/BGE-Reasoner):由向量空间实验室维护,聚焦于具备推理能力的检索模型,其榜单数据直接反映了模型在复杂场景下的信息筛选能力。
  • Bright Benchmark(<https://brightbenchmark.github.io):一个综合性的检索模型评测平台,通过多维度的数据集和严格的评估指标,为研究者和开发者提供模型性能的客观对比。

这两个榜单是当前检索重排领域的风向标,能够帮助我们快速定位最前沿的技术成果。


二、Bright Benchmark 前五名深度解析

1. INF-X-Retriever(INF)

  • 核心亮点:以63.4的总分大幅领先第二名,在榜单上形成断层优势,展现出碾压级的性能。
  • 注意事项:目前仅支持英文场景,中文任务中无法直接使用,但其技术思路值得关注。

2. DIVER-v3-GroupRank(Ant Group & Sun Yat-sen University)

  • 核心亮点:由蚂蚁集团与中山大学联合研发,以46.8分位居第二。它创新性地引入了分组排序机制,在处理大规模候选集时具备更优的效率与效果。
  • 技术价值:其论文(https://arxiv.org/abs/2508.07995)详细阐述了分组策略的设计思路,对工业界落地具有重要参考意义。

3. BGE-Reasoner-0928(USTC & BUPT & BAAI)

  • 核心亮点:由中国科学技术大学、北京邮电大学与北京智源人工智能研究院联合推出,是兼具推理能力与检索精度的代表模型。
  • 生态价值:它不仅在榜单上表现优异,还拥有完整的开源生态(https://github.com/VectorSpaceLab/agentic-search/tree/main/BGE-Reasoner),便于开发者进行二次开发与部署。

4. Lattice Hierarchical Retrieval(UT Austin & UCLA & Google)

  • 核心亮点:由德克萨斯大学奥斯汀分校、加州大学洛杉矶分校与谷歌团队共同开发,采用独特的分层格子结构,能够高效处理多粒度的语义信息。
  • 开源支持:项目已开源(https://github.com/nilesh2797/lattice),其分层检索的架构设计为处理复杂长文本提供了新的技术路径。

5. ReasonRank (rerank RaDer)(RUC & Baidu & CMU)

  • 核心亮点:由中国人民大学、百度与卡内基梅隆大学联合打造,是一款专注于重排任务的模型,通过对召回结果的二次精排,显著提升最终检索的准确率。
  • 技术定位:它证明了在检索流程中,“重排”环节对最终效果的决定性作用,与“召回”环节同等重要。

三、其他值得关注的模型与工具

🌟 行业标杆与创新突破

  • hifi-rag:NeurIPS 2025冠军模型,其核心创新在于用大模型做内容过滤,打破了“唯召回率论”的行业惯性,强调“过滤效果才是提升RAG性能的关键”。
  • Youtu-Embedding:在CMTEB(中文多模态嵌入基准)榜单上效果最好的中文嵌入模型,是处理中文场景的首选方案之一。
  • ReasonEmbed:与BGE-Reasoner同属一个开源生态,专注于生成具备推理能力的文本嵌入,为后续的检索与重排提供了高质量的语义基础。

🛠️ 实用工具与衍生模型

  • jina-embedding:由Jina AI推出的轻量级嵌入模型,以高效的部署体验和稳定的性能,在开发者社区中广受好评。
  • conan-v1:一款新兴的重排模型,通过结合上下文感知的注意力机制,在动态场景下展现出出色的自适应能力。
  • Yuan-embedding-2.0-zh:其创新的训练范式值得研究,尤其在处理低资源语言和领域适配场景时,提供了新的技术思路。

📊 经典与生态工具

  • cross-encoder/stsb-roberta-base:经典的交叉编码器模型,在语义相似度计算任务中表现稳定,是许多重排系统的基线选择。
  • ColBERT:通过交互式注意力机制实现细粒度的语义匹配,是学术界和工业界都广泛认可的检索模型。
  • Qwen带提示词重排:基于通义千问大模型的重排方案,通过精心设计的提示词工程,充分释放大模型的推理能力来优化排序结果。
  • SBERT:经典的语义相似度模型,其论文(https://arxiv.org/abs/1908.10084)被引次数极高,至今仍是构建语义检索系统的基石。

🧩 Milvus 生态工具

  • Phrase Match:Milvus的短语查询功能,支持多个关键词短语的精确匹配,非常适合需要精准定位关键词的检索场景。
  • zilliz/semantic-highlight-bilingual-v1:Milvus推出的语义高亮模型,通过对召回结果的token级打分,能够更细粒度地计算句子与查询的相似度,提升检索结果的可解释性。

我可以帮你整理一份检索重排选型对照表,把这些模型的核心特点、适用场景和优缺点都列出来,方便你快速做技术选型。需要吗?

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/18 1:55:08

企业软件供应链安全治理立项,方案书/立项书该怎么写?

当CTO或安全负责人指示“今年要把软件供应链安全做起来”时&#xff0c;很多项目负责人往往会陷入迷茫&#xff1a;“到底是应该买个SCA工具扫一扫&#xff1f;还是建立一套复杂的流程呢&#xff1f;我的项目立项书/方案书到底应该怎么写&#xff1f;后续的落地要怎么规划呢&am…

作者头像 李华
网站建设 2026/4/18 3:27:45

工具Cursor(三)MCP(1)介绍

一、在哪里添加McpServers 1、位置 Cursor是一个很好的Mcp Client&#xff0c;可以通过Cursor Setting--Tools & MCP --New Mcp Server来管理mcp tools。 添加之后都会展示在tools列表&#xff1a; 2、mcpServers 与 MCP 协议的边界 这是很多人会混淆的地方&#xff1a;…

作者头像 李华
网站建设 2026/4/18 3:26:43

2026年GEO服务商排名:专注于品牌曝光和AI搜索推荐优化的公司

在2026年的数字营销语境下&#xff0c;企业对GEO&#xff08;生成式引擎优化&#xff09;的认知已从“尝鲜”转向“深耕”。随着DeepSeek、Kimi、腾讯元宝等AI大模型成为用户获取信息的“超级入口”&#xff0c;市面上涌现了大量打着GEO旗号的服务商。但企业主很快发现&#xf…

作者头像 李华
网站建设 2026/4/18 3:25:58

企业如何破解业法财融合痛点?AI风控探针的 4 个落地步骤

本文由幂律智能团队发布&#xff0c;核心探讨了 2026 年法律科技的关键技术——AI 风控探针。文章详细拆解了 AI 如何通过多 Agent 协作模式解决业法财深度融合中的数据割裂难题。重点涵盖&#xff1a;1. 如何通过拆解任务解决大模型幻觉&#xff0c;使合同审查准确率提升至 95…

作者头像 李华
网站建设 2026/4/18 3:26:56

10 个常用在线简历制作网站体验对比,新手也能快速上手

历不是写出来的&#xff0c;是“被读出来的”&#xff1a;10 个常用简历网站体验与评分 找工作第一步是简历&#xff0c;但真正让人头大的&#xff0c;往往不是写经历&#xff0c;而是排版、结构和内容怎么搭配。 尤其是实习生和大学生&#xff0c;内容本就不多&#xff0c;一…

作者头像 李华
网站建设 2026/4/18 3:29:18

Python 在 AI 芯片管理中的实战指南——从监控调度到智能优化,让异构算力不再“黑盒”

Python 在 AI 芯片管理中的实战指南 ——从监控调度到智能优化,让异构算力不再“黑盒” 大家好,我是 Echo_Wish。今天咱们聊一个非常接地气、也很前沿的话题: 👉 Python 在 AI 芯片管理中的实际应用价值。 平时我们说 AI 芯片,更容易联想到算力、模型推理、训练性能和…

作者头像 李华