news 2026/4/18 7:56:59

AI开发者的“救命稻草“:RAG、知识库和Embedding,让大模型无所不知!

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
AI开发者的“救命稻草“:RAG、知识库和Embedding,让大模型无所不知!

今年以来,AI 技术已经融入了我们的工作和生活中。我们通过 AI 问答逐渐取代了之前传统的搜索,有了 AI 的加持,我们的工作效率和生活便捷度确实提高了不少。今天,我们就一起来了解下 AI 技术中 RAG、知识库和 Embedding 这三门技术的使用背景和技术原理。

现在的主流 AI 仍基于通用数据训练,存在诸多局限:当你想问一些特定场景和垂直领域的知识,比如你在 AI 工具中问 “张佳是谁?”,大模型就显得有点力不从心,甚至答非所问。因为大模型可能真的不知道答案,它需要你提供更多的知识 —— 它没有我们特定场景需要的一些知识资料,流程如下图:

那如何解决特定场景或垂直领域的知识需求呢?答案就是给它 “外挂” 一个知识库。这样一来,如果我们有问题询问 AI 工具,AI 工具不会直接去调用大模型,而是先在我们的知识库或数据库中进行一轮查询,搜集与该问题相关的资料。找到资料以后,它会把所有查询到的资料和用户原本的问题一起打包,变成一个新的提示词传递给大模型。这时,大模型收到的就不只是一个问题了,而是包含用户提问和知识库检索结果的完整信息,大模型只需根据问题将答案二次编辑后返回给用户,如下图:

Embedding 是大模型技术中最基础、最核心的概念之一,它就像一把 “翻译钥匙”,能把现实世界中五花八门的对象(文字、图片、音频、用户行为、知识图谱节点……)统一转换成模型能看懂、能计算的 “向量语言”。

大家还记得我们在[大模型(AI)生成原理]理中的 “向量化” 时提到的内容吗?我们说大模型所用的向量化技术,核心优势在于通过 “向量夹角” 的形式,快速匹配出相似或相关的内容。所以,如果我们把用户的问题拆解为关键词,再去知识库中以关键词形式检索,之后返回结果,这个过程效率会很低;但如果我们将所有知识资料全部进行嵌入向量化处理,使其与大模型所需的向量格式保持一致,那么检索效率就会大幅提升。

那 RAG 又是什么呢?RAG 是 Retrieval(检索)、Augmentation(增强)、Generation(生成)的缩写。简单来说,如果我们直接询问大模型,而大模型无法回答某个问题,那么在调用大模型之前,我们会先让机器人去网络或知识库上搜索相关资料,搜索完成后,将搜索结果与用户问题整合,再调用大模型生成最终答案 —— 这个过程就是 RAG 的核心逻辑。

大家看到的所谓 RAG、所谓知识库,其实本质是让大模型变成了一个帮我们完成 “编辑任务” 的工具。这时,我们并没有真正用到大模型所谓的 “认知”“理解知识” 的能力,也没有依赖大模型自身的知识储备,只是让它帮我们对信息进行了一次编辑整合,这就是 RAG 和知识库最基础的应用逻辑。

伙伴们,今天只是对 RAG、知识库和 Embedding 做了简单介绍。接下来的三篇文章,我会分别通过《1-1 RAG 的核心原理和主流架构》《1-2 文档处理和 Embedding》以及《1-3 RAG 的检索召回、混合增强和提示词兜底》,深入分享它们的技术原理和业务场景。

如何学习大模型 AI ?

由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。

但是具体到个人,只能说是:

“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。

这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。

我在一线科技企业深耕十二载,见证过太多因技术卡位而跃迁的案例。那些率先拥抱 AI 的同事,早已在效率与薪资上形成代际优势,我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在大模型的学习中的很多困惑。我们整理出这套AI 大模型突围资料包

  • ✅ 从零到一的 AI 学习路径图
  • ✅ 大模型调优实战手册(附医疗/金融等大厂真实案例)
  • ✅ 百度/阿里专家闭门录播课
  • ✅ 大模型当下最新行业报告
  • ✅ 真实大厂面试真题
  • ✅ 2025 最新岗位需求图谱

所有资料 ⚡️ ,朋友们如果有需要《AI大模型入门+进阶学习资源包》下方扫码获取~

① 全套AI大模型应用开发视频教程

(包含提示工程、RAG、LangChain、Agent、模型微调与部署、DeepSeek等技术点)

② 大模型系统化学习路线

作为学习AI大模型技术的新手,方向至关重要。 正确的学习路线可以为你节省时间,少走弯路;方向不对,努力白费。这里我给大家准备了一份最科学最系统的学习成长路线图和学习规划,带你从零基础入门到精通!

③ 大模型学习书籍&文档

学习AI大模型离不开书籍文档,我精选了一系列大模型技术的书籍和学习文档(电子版),它们由领域内的顶尖专家撰写,内容全面、深入、详尽,为你学习大模型提供坚实的理论基础。

④ AI大模型最新行业报告

2025最新行业报告,针对不同行业的现状、趋势、问题、机会等进行系统地调研和评估,以了解哪些行业更适合引入大模型的技术和应用,以及在哪些方面可以发挥大模型的优势。

⑤ 大模型项目实战&配套源码

学以致用,在项目实战中检验和巩固你所学到的知识,同时为你找工作就业和职业发展打下坚实的基础。

⑥ 大模型大厂面试真题

面试不仅是技术的较量,更需要充分的准备。在你已经掌握了大模型技术之后,就需要开始准备面试,我精心整理了一份大模型面试题库,涵盖当前面试中可能遇到的各种技术问题,让你在面试中游刃有余

以上资料如何领取?

为什么大家都在学大模型?

最近科技巨头英特尔宣布裁员2万人,传统岗位不断缩减,但AI相关技术岗疯狂扩招,有3-5年经验,大厂薪资就能给到50K*20薪!

不出1年,“有AI项目经验”将成为投递简历的门槛。

风口之下,与其像“温水煮青蛙”一样坐等被行业淘汰,不如先人一步,掌握AI大模型原理+应用技术+项目实操经验,“顺风”翻盘!

这些资料真的有用吗?

这份资料由我和鲁为民博士(北京清华大学学士和美国加州理工学院博士)共同整理,现任上海殷泊信息科技CEO,其创立的MoPaaS云平台获Forrester全球’强劲表现者’认证,服务航天科工、国家电网等1000+企业,以第一作者在IEEE Transactions发表论文50+篇,获NASA JPL火星探测系统强化学习专利等35项中美专利。本套AI大模型课程由清华大学-加州理工双料博士、吴文俊人工智能奖得主鲁为民教授领衔研发。

资料内容涵盖了从入门到进阶的各类视频教程和实战项目,无论你是小白还是有些技术基础的技术人员,这份资料都绝对能帮助你提升薪资待遇,转行大模型岗位。

以上全套大模型资料如何领取?

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/18 2:21:06

2025年,宝妈宝爸如何用创意设计实现带娃与远程工作双赢?

在2025年,越来越多的父母正在探索一种全新的生活工作模式:一边陪伴孩子成长,一边通过创意设计实现职业价值。 这不仅是平衡,更是融合。将父母角色、创意工作者、远程办公者和终身学习者这多重身份巧妙编织,正成为新时代家庭的新选择。 一、带娃与工作:不是平衡,而是融合…

作者头像 李华
网站建设 2026/4/15 20:15:40

当AI开始“理解”招标文件:一次对招投标信息平台的极限测试

我们进行了一次为期两个月的深度测试,焦点不再是平台的信息覆盖面或推送速度——这些已成为头部平台的基准线。此次评测的核心,是检验以立达标讯为代表的智能招投标信息平台,其AI能力是否已从“匹配关键词”进阶到“理解项目内涵”&#xff0…

作者头像 李华
网站建设 2026/3/15 1:00:39

基于SpringBoot的网络异常流量检测系统的设计与实现(程序+文档+讲解)

课题介绍在网络安全防护精细化、异常流量识别实时性需求升级的背景下,传统流量监控存在 “识别滞后、误报率高、适配性差” 的痛点,基于 SpringBoot 构建的网络异常流量检测系统,适配网络管理员、安全运维人员等角色,实现流量采集…

作者头像 李华
网站建设 2026/4/18 7:52:57

钉钉一口气发布超20个新品:Agent OS操作系统让AI从问答走向干活

12月23日,AI钉钉1.1新品发布暨生态大会在杭州举办,钉钉正式发布全球首个为AI打造的工作智能操作系统——Agent OS,由此开启“人与AI协同”的全新工作方式。据「TMT星球」了解,AI钉钉1.1版本名为“木兰”,距离钉钉发布A…

作者头像 李华
网站建设 2026/4/18 3:19:40

如何通过熊猫智汇释放数字员工的潜力?

数字员工在现代运营中扮演着至关重要的角色,特别是在优化业务流程、降低成本和提升效率方面。通过采纳AI销冠系统,数字员工能够执行自动化的客户沟通和服务,显著减少了人工干预。企业可以借助这一系统提升服务触达率,实现不间断响…

作者头像 李华
网站建设 2026/4/18 6:30:03

PHP 新手最容易写出“慢代码”的 20 种姿势(你肯定中招过)

你有没有遇到过这种情况👇程序能跑,但越来越慢本地没问题,一上线就卡一查日志,全是: Maximum execution time exceeded很多新手第一反应是: 👉 “服务器不行” 说句实话: 80% 的慢&a…

作者头像 李华