news 2026/6/10 10:32:51

yyds!给大模型装上记忆系统,让AI不再“金鱼记忆“,小白也能秒变Agent架构师!

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
yyds!给大模型装上记忆系统,让AI不再“金鱼记忆“,小白也能秒变Agent架构师!

本质上,目前的LLM只是一个无状态的函数。输入,计算,输出,结束。每一次交互,对它来说都是初见。

要让工具进化为Agent,必须引入状态。这个状态,就是记忆。没有记忆,智能就无法在时间维度上积累;没有积累,就没有复利。

构建记忆系统,就是赋予AI在时间长河中航行的能力。

一、记忆的本质

在计算机科学里,记忆就是状态管理。LLM天生无状态。为了延续,必须外挂存储。

我们通常把这个外挂分为两类:

  1. 短期记忆:像内存,快,贵,存当下。
  2. 长期记忆:像硬盘,慢,廉,存历史。

二、短期记忆

短期记忆,即 Prompt 中的 Context(上下文)。是 Agent 当前的工作台,摆着正在处理的任务,和刚说的话。

容量限制

强如GPT-4,上下文窗口也有极限(如128k token)。更要命的是成本和延迟。

对话越长,烧的钱越多,反应越慢。人不能把一辈子的事都塞进大脑前额叶,AI也一样。

优化策略

我们需要对短期记忆进行治理,核心在于压缩与丢弃。

短期记忆优化策略

滑动窗口

只保留最近的N轮对话,旧的直接扔掉。

简单,可控。但健忘,容易丢掉早期的关键信息。

摘要压缩

当对话超出阈值,触发后台任务,让LLM对历史进行摘要。 将 你好,我叫小明,我是一名程序员… 压缩为 用户是小明,职业程序员。

省空间,留核心。但细节丢了,计算成本也上去了。

三、长期记忆

如果短期记忆是工作台,长期记忆就是无限扩容的图书馆。当用户问起上个月讨论的架构方案,滑动窗口早就把它丢了,这时候,需要去图书馆里翻书。

向量数据库

长期记忆的载体,不是MySQL,而是向量数据库 (Vector DB)。人类的记忆是模糊的、关联的。你记不住一句话的ASCII码,但你能记住它的语义

Vector DB通过Embedding技术,将文本转化为高维向量。在这个高维空间里,苹果和水果离得很近,但苹果和汽车就离得很远。

AI记忆系统架构图

RAG机制

RAG(Retrieval Augmented Generation)是长对话的解决方案。

RAG流程图

当用户Query到来时:

  • 感知:将Query转化为向量。
  • 检索:在向量库中寻找距离最近的Top-K片段。
  • 增强:将这些片段作为参考资料塞进Prompt。
  • 生成:LLM基于参考资料回答。

这解决了记忆容量问题,也缓解了幻觉问题。

四、架构融合

孤立的短期或长期记忆都不够完善,智能,在于两者的流动。

记忆巩固

人睡觉时,会将短期记忆固化为长期记忆,Agent 也需要这个过程。

记忆巩固流程图

交互时,全靠短期记忆抗。会话结束了,就提取关键信息。接着入库,把信息向量化,存进长期记忆。下次唤醒,先查库,构建好上下文,再开口。

五、写在最后

记忆不是存储,而是选择。遗忘和记住同样重要。如果记住了所有噪音,就听不见信号。

过滤掉平庸的日常,留下有价值的数据。这才是 Agent 的核心。

那么,如何系统的去学习大模型LLM?

作为一名深耕行业的资深大模型算法工程师,我经常会收到一些评论和私信,我是小白,学习大模型该从哪里入手呢?我自学没有方向怎么办?这个地方我不会啊。如果你也有类似的经历,一定要继续看下去!这些问题啊,也不是三言两语啊就能讲明白的。

所以我综合了大模型的所有知识点,给大家带来一套全网最全最细的大模型零基础教程。在做这套教程之前呢,我就曾放空大脑,以一个大模型小白的角度去重新解析它,采用基础知识和实战项目相结合的教学方式,历时3个月,终于完成了这样的课程,让你真正体会到什么是每一秒都在疯狂输出知识点。

由于篇幅有限,⚡️ 朋友们如果有需要全套 《2025全新制作的大模型全套资料》,扫码获取~

👉大模型学习指南+路线汇总👈

我们这套大模型资料呢,会从基础篇、进阶篇和项目实战篇等三大方面来讲解。

👉①.基础篇👈

基础篇里面包括了Python快速入门、AI开发环境搭建及提示词工程,带你学习大模型核心原理、prompt使用技巧、Transformer架构和预训练、SFT、RLHF等一些基础概念,用最易懂的方式带你入门大模型。

👉②.进阶篇👈

接下来是进阶篇,你将掌握RAG、Agent、Langchain、大模型微调和私有化部署,学习如何构建外挂知识库并和自己的企业相结合,学习如何使用langchain框架提高开发效率和代码质量、学习如何选择合适的基座模型并进行数据集的收集预处理以及具体的模型微调等等。

👉③.实战篇👈

实战篇会手把手带着大家练习企业级的落地项目(已脱敏),比如RAG医疗问答系统、Agent智能电商客服系统、数字人项目实战、教育行业智能助教等等,从而帮助大家更好的应对大模型时代的挑战。

👉④.福利篇👈

最后呢,会给大家一个小福利,课程视频中的所有素材,有搭建AI开发环境资料包,还有学习计划表,几十上百G素材、电子书和课件等等,只要你能想到的素材,我这里几乎都有。我已经全部上传到CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

相信我,这套大模型系统教程将会是全网最齐全 最易懂的小白专用课!!

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/8 18:48:08

程序员必看!大模型技术学习路径与实战指南,建议收藏

文章为普通人提供了学习大模型技术的系统路径,涵盖提示词工程、RAG技术、LangChain应用、模型微调、AI Agent开发及多模态学习等关键领域。详细介绍了各项技术的原理、实践方法和应用场景,对比了AI测试与传统测试的区别,强调了数据质量验证、…

作者头像 李华
网站建设 2026/5/28 5:14:29

Z-Image模型图像质量评估指标:FID、CLIP Score等分析

Z-Image模型图像质量评估指标:FID、CLIP Score等分析 在生成式AI飞速演进的今天,文本到图像(Text-to-Image)技术早已不再是实验室里的概念玩具,而是实实在在驱动内容创作、电商设计和数字艺术的核心引擎。阿里推出的 Z…

作者头像 李华
网站建设 2026/6/7 6:11:37

ToolBlock高级脚本之显示文本

ToolBlock高级脚本之显示文本// 用于存储要在图像上显示的图形标签的列表List<CogGraphicLabel> graphics_label new List<CogGraphicLabel>(); // 建立List// 定义了一个Arial字体&#xff0c;大小为12磅Font mFont1 new Font("Arial", 12); // 字体1…

作者头像 李华
网站建设 2026/6/10 10:24:46

Z-Image-Turbo在智能客服图文回复中的创新应用

Z-Image-Turbo在智能客服图文回复中的创新应用 在今天的智能客服系统中&#xff0c;用户早已不满足于“文字对文字”的机械问答。当客户问出“这款手表戴在手上是什么样子&#xff1f;”、“怎么连接蓝牙耳机&#xff1f;”这类问题时&#xff0c;仅靠语言描述往往难以准确传达…

作者头像 李华
网站建设 2026/6/10 10:18:58

Zotero PDF Translate插件:高效翻译与笔记管理一体化解决方案

Zotero PDF Translate插件&#xff1a;高效翻译与笔记管理一体化解决方案 【免费下载链接】zotero-pdf-translate 支持将PDF、EPub、网页内容、元数据、注释和笔记翻译为目标语言&#xff0c;并且兼容20多种翻译服务。 项目地址: https://gitcode.com/gh_mirrors/zo/zotero-p…

作者头像 李华
网站建设 2026/5/30 10:33:59

PlayCover性能调优终极指南:5个技巧告别Mac游戏卡顿

PlayCover性能调优终极指南&#xff1a;5个技巧告别Mac游戏卡顿 【免费下载链接】PlayCover Community fork of PlayCover 项目地址: https://gitcode.com/gh_mirrors/pl/PlayCover 还在为Mac上玩iOS游戏时的卡顿、延迟和发热问题困扰吗&#xff1f;作为一款强大的iOS应…

作者头像 李华