终于搞懂 LLM、RAG 和 AI Agent 了-程序员充电站

用了 AI 这么久，搞懂 LLM、RAG 和 AI Agent 这三个的关系。

他们不是竞争对手，而是相辅相成的存在。

LLM：大型语言模型

RAG：检索增强生成

AI Agent：也就是经常说到的 AI 智能体。

如果把AI系统比作一个人，大多数人只给了它一个“大脑”（LLM），却忘了给它“长期记忆”（RAG）和能决策行动的“手脚”（AI Agent）。

大脑（LLM）

大型语言模型（LLM）是这个智能堆栈的“大脑”。它拥有强大的推理、写作和理解自然语言的能力。我们平时用聊天方式使用ChatGPT、Gemini、豆包这些 APP，基本上都是在和一个有智慧的大脑进行沟通。

然而，它有一个致命的弱点，那就是它的知识是静止的，被完全冻结在了训练完成的时间点。

假设有一个大模型是在今年5月份发布的，那这个大模型只知道5月份之前的信息。你让它对6月份的某个事件发表建议，它是不知道的，只能胡编。

因为这个限制的存在，导致 LLM 虽然强大，却与现实世界脱节，或者说与现实世界不同步。

记忆系统（RAG）

RAG 本意是检索增强生成。

它的核心作用，就是将那个“静止的大脑”（LLM）与外部的、实时的知识数据库连接起来。

当用户提出问题时，RAG 会先在外部数据库中搜索并提取最相关的文档，然后将这些信息作为上下文一同提供给 LLM。

例如我在DeepSeek中询问“北京明天的天气”时，如果开启联网搜索的话，基本上能回答正确（有误差），可以看到右侧是 DeepSeek 查询的几个网页。

这个搜索网页的动作就是 RAG 。

而如果不勾选联网搜索呢？DeepSeek 就诚实的告诉你，它知道你想干什么，但是它办不到。

RAG 的加入，让 LLM 功力大增。

动态更新能力：静态的 LLM 突然间拥有了访问全新数据的能力，能够获取真实、及时的信息，而这一切都无需对模型本身进行重新训练。

准确性与可审计性：模型不再依赖其固有的、可能过时的训练数据进行“猜测”。相反，它基于实际检索到的信息进行推理。这不仅让准确率“立竿见影”，还意味着你可以精确地审核每个答案的来源是哪些文档。

AI Agent

尽管我们有了能思考的“大脑”和能记忆的“知识库”，但整个系统仍然比较被动。

它无法与世界互动。这时候，就轮到 AI Agent 登场了，它带来了动手能力，让智能不再是缸中之脑。

一个代理能够感知一个设定的目标，然后自主地规划步骤、执行行动，并根据结果进行反思和调整。

它不仅仅是回答问题，它还能执行复杂的多步骤任务，例如“研究主题、提取数据、生成报告并发送电子邮件”、自动修bug并提交代码。

使用场景

在实际的应用中，它们不是必须同时搭配使用的，而是有各自擅长的领域。

单独使用 LLM：当你的任务是纯粹的语言处理时，比如写作、总结或解释概念，单独使用 LLM 就足够了。

添加 RAG：当准确性至关重要时，就要加入 RAG 技术了。适用于需要从内部文档、技术手册或特定领域知识库中获取精确答案的场景。

AI Agent：当你需要系统具备真正的自主性时，就应该使用 Agent 了。例如那种需要比较复杂的流程才能完成的事情。比如用 Coze、n8n 搭建工作流，前段时间看到的“假如书籍会说话”这个工作流，输入一本书，最后产出的是一个有画面、有讲解、有字幕的完整视频。

读者福利：如果大家对大模型感兴趣，这套大模型学习资料一定对你有用

对于0基础小白入门：

如果你是零基础小白，想快速入门大模型是可以考虑的。
一方面是学习时间相对较短，学习内容更全面更集中。
二方面是可以根据这些资料规划好学习计划和方向。

作为一名老互联网人，看着AI越来越火，也总想为大家做点啥。干脆把我这几年整理的AI大模型干货全拿出来了。
包括入门指南、学习路径图、精选书籍、视频课，还有我录的一些实战讲解。全部免费，不搞虚的。
学习从来都是自己的事，我能做的就是帮你把路铺平一点。资料都放在下面了，有需要的直接拿，能用到多少就看你自己了。

这份完整版的大模型 AI 学习资料已经上传CSDN，朋友们如果需要可以点击文章最下方的VX名片免费领取【保真100%】

为什么你的Open-AutoGLM这么慢？90%的人都忽略了这2个配置细节

第一章：Open-AutoGLM运行的慢在部署和使用 Open-AutoGLM 模型时，用户普遍反馈其推理速度较慢，影响实际应用场景下的响应效率。该问题可能由多个因素导致，包括模型结构复杂度、硬件资源配置不足以及推理优化策略未启用等。模型自身…

李华

揭秘智谱Open-AutoGLM安装内幕：为什么你的环境总是配置失败？

第一章：智谱Open-AutoGLM开源如何安装环境准备在安装 Open-AutoGLM 之前，需确保系统已配置 Python 环境，并推荐使用虚拟环境以避免依赖冲突。建议使用 Python 3.9 或更高版本。安装 Python 3.9配置虚拟环境：# 创建虚拟环境 pytho…

李华

大模型透明度测评入门到精通：15款模型大起底，两款允许撤回数据（附报告），收藏这一篇就够了！

15款被测国产大模型应用中，仅有DeepSeek主动说明训练数据的大致来源，其他被测大模型仍相当不透明。两款大模型DeekSeek、腾讯元宝提供退出开关，允许用户选择是否将所有数据用于优化体验。这是南都数字经济治理研究中心实测15款国产大模型的…

李华

【机械设计专业论文写作模版】基于SolidWorks的卧式液压千斤顶结构设计与三维建模：轻量化便携式汽车维修装备开发

内容概要：本文围绕一种小型卧式液压千斤顶的结构设计与仿真展开，重点阐述了其动力系统和传动系统的设计过程。设计采用闭式液压系统与单行程液压缸，以满足便携性与实用性需求。通过机械设计手册进行关键部件如液压缸、起重臂、机架和行走机构…

李华

上万“僵尸账号”罕见突袭快手直播，安全专家揭秘“攻击链”：灰黑产攻击技术与防御

程序员必藏！快手直播遭大规模网络攻击事件解析：灰黑产攻击技术与防御之道快手直播平台遭大规模网络攻击，数万个僵尸账号涌入传播违规内容。攻击成本可能超百万元，暴露平台防护漏洞。安全专家指出，灰黑产通过突破审核…

李华

体积小巧，功能强大

今天给大家介绍两款电脑性能与网络见空工具，一款是LiteMonitor，另外一款是TrafficMonitor，有需要的小伙伴可以下载收藏。第一款：LiteMonitor 说到网速、CPU监空软件，个人觉得TrafficMonitor就非常好用，因为…

李华