news 2026/4/18 10:35:42

RAG 是 Retrieval-Augmented Generation(检索增强生成) 是什么

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
RAG 是 Retrieval-Augmented Generation(检索增强生成) 是什么

一、为什么需要 RAG?

单纯的大模型(如 GPT)有几个天然问题:

  • 知识有截止时间(训练后发生的新信息不知道)

  • 不能直接访问你的私有数据(文档、数据库、公司内部资料)

  • 容易“胡编”(hallucination)

RAG 的目的就是:
用“可控、可更新、可追溯”的外部知识,约束并增强大模型的回答。

二、RAG 的基本工作流程(非常重要)

经典 RAG = 4 个步骤

1️⃣ 文档准备(Indexing)

  • 把资料切成 chunk(例如 500~1000 tokens)

  • 用 Embedding 模型转成向量

  • 存入 向量数据库

常见向量库:

  • FAISS

  • Milvus

  • Pinecone

  • Weaviate

  • OpenSearch / Elasticsearch(向量模式)

2️⃣ 用户提问

“加拿大魁省的 Welcome Tax 是怎么计算的?”

3️⃣ 检索(Retrieval)

把用户问题也转成向量

在向量库里找 语义最相近的文档片段

通常取 Top-k(如 3~10 段)

⚠️ 不是关键词搜索,是语义搜索

4️⃣ 生成(Generation)

把检索结果 + 用户问题,一起喂给 LLM:

【已知资料】

  • 文档1:……
  • 文档2:……

【问题】
……

【请基于以上资料回答】

➡️ 模型只能“照着资料说”,而不是凭空发挥。

三、RAG ≠ 微调(Fine-tuning)

这是一个非常常见的误区:

对比RAG微调
是否改模型参数❌ 不改✅ 改
数据更新✅ 随时更新❌ 重新训练
私有数据✅ 非常适合⚠️ 成本高
幻觉风险仍可能
成本

现实项目中:90% 用 RAG,10% 才需要微调

四、RAG 特别适合什么场景?

结合你的背景,其实你已经“非常适合 RAG”

✅ 典型应用

  • 企业 / 项目文档问答

  • 技术文档(AWS / Angular / Java / Keycloak)

五、一个非常直观的比喻

LLM = 会写作文的学生
RAG = 给他一本开卷考试的资料

不开卷 → 靠记忆 → 容易瞎写
开卷 → 查资料 → 有据可依

六、工程视角:一个最小 RAG 架构

[用户问题][Embedding][VectorDB]——>Top-k 文档 ↓[Prompt 拼接][LLM生成答案]

七、RAG 的进阶玩法(你后面一定会用到)

  • Hybrid Search:向量 + 关键词(BM25)

  • Re-ranking:再用模型重新排序

  • Metadata Filter:按国家 / 时间 / 来源过滤

  • Multi-step RAG:先拆问题再检索

  • Agent + RAG:自动决定查什么

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/18 8:35:54

混元翻译黑科技落地实践|基于HY-MT1.5-7B镜像的实时翻译方案

混元翻译黑科技落地实践|基于HY-MT1.5-7B镜像的实时翻译方案 你有没有遇到过这样的场景:跨国会议中,发言人语速飞快,翻译却卡在“直译”阶段,把一句“Break a leg”真翻成“打断一条腿”?又或者&#xff0…

作者头像 李华
网站建设 2026/4/18 7:36:58

IQuest-Coder-V1训练范式解析:为何能超越静态代码模型?

IQuest-Coder-V1训练范式解析:为何能超越静态代码模型? IQuest-Coder-V1-40B-Instruct 是当前面向软件工程与竞技编程领域最具突破性的代码大语言模型之一。它不仅在多个权威编码基准测试中刷新纪录,更通过一套全新的训练范式,重…

作者头像 李华
网站建设 2026/4/8 16:22:38

如何高效做图像分割?试试SAM3大模型镜像,自然语言精准提取掩码

如何高效做图像分割?试试SAM3大模型镜像,自然语言精准提取掩码 1. 引言:让图像分割像说话一样简单 你有没有遇到过这样的问题:想从一张复杂的图片里把某个物体单独抠出来,比如一只狗、一辆红色汽车,或者一…

作者头像 李华
网站建设 2026/4/18 8:10:05

Qwen3-0.6B客服机器人实战:基于LangChain的对话系统搭建

Qwen3-0.6B客服机器人实战:基于LangChain的对话系统搭建 你是否正在寻找一个轻量级、响应快、部署简单的语言模型来构建企业级客服对话系统?Qwen3-0.6B 正是为此而生。作为通义千问系列中最小的密集型模型,它在保持高性能推理能力的同时&…

作者头像 李华
网站建设 2026/4/18 7:57:47

IQuest-Coder-V1医疗编码实战:病历结构化脚本生成教程

IQuest-Coder-V1医疗编码实战:病历结构化脚本生成教程 1. 你能用它做什么?快速上手前的期待 你有没有遇到过这样的情况:医院系统里堆着成千上万份非结构化的病历文本,想提取关键信息做分析,却只能靠人工一条条翻看、…

作者头像 李华
网站建设 2026/4/17 23:14:26

手把手部署DeepSeek-OCR-WEBUI|附真实识别效果评测

手把手部署DeepSeek-OCR-WEBUI|附真实识别效果评测 1. 部署前你需要知道的 你是不是也和我一样,看到最近 DeepSeek 推出的 OCR 大模型后,第一反应就是:这玩意儿能不能用在日常文档扫描、票据识别或者办公自动化上?毕…

作者头像 李华