LangChain Memory 最佳实践：别再用错记忆模块了-程序员充电站

上一篇我们把 Memory 的三种策略——截断、总结、检索——从原理到选型梳理了一遍。这篇直接进实战：你现在用的 Memory 写法，可能已经被官方标注为"过时"了，而且坑还不少。

作为开发者，最怕的不是不会用，而是用错了还不知道——跑起来没报错，上线了才发现对话记忆时好时坏，Token 开销莫名爆表，多用户串话。

这篇把最常踩的坑一一拆开，附上可运行的正确写法。

01 你真的了解 Memory 在 LangChain 里的位置吗

很多人把 Memory 当成一个独立的"记忆插件"，插上去就能用。

实际上，Memory 只做一件事：在每次调用时，往 Prompt 里塞历史消息。

用户输入 ↓ Memory.load_memory_variables() ← 读历史，注入 Prompt ↓ LLM 推理 ↓ Memory.save_context() ← 写历史 ↓ 返回输出

┌─────────────────────────────────────────────────┐ │ 一次完整对话轮次 │ │ │ │ [用户输入] ──► [Memory读取] ──► [Prompt组装] │ │ │ │ │ ▼ │ │ 历史消息注入模板 │ │ │ │ │ ▼ │ │ [LLM推理] ──► [输出] │ │ │ │ │ ▼ │ │ [Memory写入] ← save_context() │ └─────────────────────────────────────────────────┘

理解这个流程，很多坑就自然明白了。

02 最高频的坑：Memory 没有被调用

先看一个典型的错误写法：

importConversationBufferMemoryfrom"langchain/memory"importChatOpenAIfrom"@langchain/openai"importLLMChainfrom"langchain/chains"importChatPromptTemplatefrom"@langchain/core/prompts"constnewConversationBufferMemoryconstnewChatOpenAImodelName"gpt-3.5-turbo"constChatPromptTemplatefromMessages"system""你是一个助手。""human""{input}"// ❌ 错误：Memory 传了，但 Prompt 里没有 {history} 占位符constnewLLMChainawaitcallinput"我叫张三"awaitcallinput"我叫什么名字？"// 它不记得！

问题在哪？Prompt 里没有{history}占位符，历史消息根本没被注入。

正确写法：

importConversationBufferMemoryfrom"langchain/memory"importChatOpenAIfrom"@langchain/openai"importLLMChainfrom"langchain/chains"importChatPromptTemplateMessagesPlaceholderfrom"@langchain/core/prompts"constnewConversationBufferMemoryreturnMessagestrue// 返回消息对象，而非字符串memoryKey"history"// 与 Prompt 占位符名称一致constnewChatOpenAImodelName"gpt-3.5-turbo"// ✅ 正确：Prompt 里有 MessagesPlaceholderconstChatPromptTemplatefromMessages"system""你是一个助手。"newMessagesPlaceholder"history"// ← 必须有这行"human""{input}"constnewLLMChainawaitcallinput"我叫张三"constawaitcallinput"我叫什么名字？"consolelogtext// 输出：你叫张三

03 五种 Memory 类型，选错了比没有还糟

LangChain 提供了 5 种内置 Memory 类型，每种定位不同：

Memory 类型选型图 短对话（<20轮） ──► ConversationBufferMemory 完整存储所有历史 中等长度对话 ──► ConversationBufferWindowMemory 只保留最近 K 轮 长对话，Token受限 ──► ConversationTokenBufferMemory 按 Token 数裁剪 超长对话，精度要求高 ──► ConversationSummaryBufferMemory 近期原文 + 早期摘要 需要语义检索历史 ──► VectorStoreRetrieverMemory 相似度召回历史片段

对比一张表：

类型	Token消耗	信息损失	适合场景
BufferMemory	随轮次线性增长	无	短对话 / 原型验证
BufferWindowMemory(K=10)	稳定在~10轮	10轮前全丢	客服/问答
TokenBufferMemory	稳定在Token上限	按Token裁剪	资源敏感场景
SummaryBufferMemory	中等，摘要压缩	细节轻微损失	长会话助手
VectorStoreMemory	低，按需检索	依赖召回精度	知识密集型Agent

生产环境里，90% 的场景用ConversationSummaryBufferMemory就够了。

04 ConversationSummaryBufferMemory：最被低估的 Memory

很多人没用过这个，觉得配起来复杂。实际上它才是最接近"人类记忆"工作方式的设计。

原理：

时间线 ────────────────────────────────────────────► 早期对话 [已压缩为摘要] 近期对话 [保留原文] ┌──────────────────────┐ ┌────────────────────────┐ │ Summary（LLM生成） │ │ Recent Messages Buffer │ │ "用户是张三，工程师 │ │ 轮次N-5 到 轮次N │ │ 正在开发RAG系统..." │ │ 完整消息对象 │ └──────────────────────┘ └────────────────────────┘ │ │ └──────────── 合并注入 Prompt ──────────────►

代码示例：

importConversationSummaryBufferMemoryfrom"langchain/memory"importChatOpenAIfrom"@langchain/openai"constnewChatOpenAImodelName"gpt-3.5-turbo"constnewConversationSummaryBufferMemory// ← 用来生成摘要的模型maxTokenLimit2000// ← Token 超过 2000 时开始摘要returnMessagestruememoryKey"history"// 随着对话增长，早期轮次自动被压缩为摘要// Token 始终控制在 maxTokenLimit 附近

一个关键细节：maxTokenLimit是触发压缩的阈值，不是硬上限。实际注入 Prompt 的 Token 可能略超这个值（因为摘要本身也有长度）。生产里建议设为上下文窗口的30%，给用户输入和输出各留足空间。

05 多用户场景的致命坑：Memory 实例共享

这个坑在测试环境不会出现，生产一上就串话。

// ❌ 危险：全局单例 Memory，所有用户共用同一个历史constnewConversationBufferMemorypost"/chat"asyncconstnewLLMChainmemoryconstawaitcallinputbodymessagejsonreplytext// 用户A的历史混入了用户B的对话！

正确做法：每个 session 对应独立的 Memory 实例。

importConversationSummaryBufferMemoryfrom"langchain/memory"importChatOpenAIfrom"@langchain/openai"// ✅ 用 Map 按 sessionId 隔离 MemoryconstnewMapstringConversationSummaryBufferMemoryfunctiongetMemorysessionId: stringConversationSummaryBufferMemoryifhassetnewConversationSummaryBufferMemoryllmnewChatOpenAImodelName"gpt-3.5-turbo"maxTokenLimit2000returnMessagestruememoryKey"history"returngetpost"/chat"asyncconstbodyconstgetMemory// ← 按用户隔离constnewLLMChainconstawaitcallinputjsonreplytext

生产里还要加过期清理，否则memoryStore会无限增长：

// 简单 TTL 清理：30分钟无活动则释放constnewMapstringnumbersetInterval() =>constDatenowforconstofif30601000deletedelete5601000// 每5分钟扫一次

06 新版写法：RunnableWithMessageHistory（LCEL 推荐方式）

LangChain v0.3 之后，官方推荐用RunnableWithMessageHistory替代旧的 Memory + Chain 写法。

区别在哪？

旧方式（Memory + LLMChain）： Memory 对象内嵌到 Chain 中，耦合紧，难复用 新方式（RunnableWithMessageHistory + LCEL）： 历史管理与 Chain 逻辑分离，sessionId 驱动，更清晰

新写法示例：

importChatOpenAIfrom"@langchain/openai"importChatPromptTemplateMessagesPlaceholderfrom"@langchain/core/prompts"importRunnableWithMessageHistoryfrom"@langchain/core/runnables"importInMemoryChatMessageHistoryfrom"@langchain/core/chat_history"constnewChatOpenAImodelName"gpt-3.5-turbo"constChatPromptTemplatefromMessages"system""你是一个助手。"newMessagesPlaceholder"history""human""{input}"constpipe// 历史存储，按 sessionId 隔离conststoreRecordstringInMemoryChatMessageHistoryfunctiongetHistorysessionId: stringifnewInMemoryChatMessageHistoryreturn// ✅ 用 RunnableWithMessageHistory 包装constnewRunnableWithMessageHistoryrunnablegetMessageHistoryinputMessagesKey"input"historyMessagesKey"history"// 调用时传入 sessionIdconstawaitinvokeinput"我叫张三"configurablesessionId"user-123"// ← 关键

这套写法和 LangGraph 的 Checkpoint 机制无缝衔接，如果你在用 LangGraph，直接用它的持久化方案就好，不需要额外引 Memory 模块。

07 生产环境自查清单

上线前对照这份清单检查一遍：

Memory 生产上线自查 □ Prompt 里有 MessagesPlaceholder / {history} 占位符 □ Memory 实例按 sessionId 隔离，没有全局单例 □ 设置了 maxTokenLimit（建议上下文窗口的 30%） □ SummaryBufferMemory 的 llm 参数已指定 □ 多进程/多实例部署时，Memory 用了外部存储（Redis/DB） □ 有 TTL 清理机制，防止 Map/内存无限增长 □ 测试过 20+ 轮对话，摘要压缩后语义未丢失 □ 多用户并发测试，确认不串话

一个容易忽视的点：在多进程/K8s 部署时，内存里的 Map 各进程不共享。这时候需要用外部存储：

importRedisChatMessageHistoryfrom"@langchain/redis"// ✅ 生产多实例部署：用 Redis 存历史functiongetHistorysessionId: stringreturnnewRedisChatMessageHistoryclientttl1800// 30 分钟过期

学AI大模型的正确顺序，千万不要搞错了

🤔2026年AI风口已来！各行各业的AI渗透肉眼可见，超多公司要么转型做AI相关产品，要么高薪挖AI技术人才，机遇直接摆在眼前！

有往AI方向发展，或者本身有后端编程基础的朋友，直接冲AI大模型应用开发转岗超合适！

就算暂时不打算转岗，了解大模型、RAG、Prompt、Agent这些热门概念，能上手做简单项目，也绝对是求职加分王🔋

📝给大家整理了超全最新的AI大模型应用开发学习清单和资料，手把手帮你快速入门！👇👇

学习路线:

✅大模型基础认知—大模型核心原理、发展历程、主流模型（GPT、文心一言等）特点解析
✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑
✅开发基础能力—Python进阶、API接口调用、大模型开发框架（LangChain等）实操
✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用
✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代
✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经

以上6大模块，看似清晰好上手，实则每个部分都有扎实的核心内容需要吃透！

我把大模型的学习全流程已经整理📚好了！抓住AI时代风口，轻松解锁职业新可能，希望大家都能把握机遇，实现薪资/职业跃迁～

python pip

LangChain Memory 最佳实践：别再用错记忆模块了

01 你真的了解 Memory 在 LangChain 里的位置吗

02 最高频的坑：Memory 没有被调用

03 五种 Memory 类型，选错了比没有还糟

04 ConversationSummaryBufferMemory：最被低估的 Memory

05 多用户场景的致命坑：Memory 实例共享

06 新版写法：RunnableWithMessageHistory（LCEL 推荐方式）

07 生产环境自查清单

学AI大模型的正确顺序，千万不要搞错了

这份完整版的大模型 AI 学习资料已经上传CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【`保证100%免费`】

GESP学习考试必读（（二）、《专治粗心的10道训练题》）

为什么 wemake-django-template 值得每个 Django 开发者学习：3个真实案例分享

IOI竞赛中动态分配计算资源的机器学习优化方案

对话式AI隐私保护：从社交媒体广告困境到技术实践

Hacker‘s Keyboard多语言支持全攻略：覆盖40+种键盘布局

01 你真的了解 Memory 在 LangChain 里的位置吗

02 最高频的坑：Memory 没有被调用

03 五种 Memory 类型，选错了比没有还糟

04 ConversationSummaryBufferMemory：最被低估的 Memory

05 多用户场景的致命坑：Memory 实例共享

06 新版写法：RunnableWithMessageHistory（LCEL 推荐方式）

07 生产环境自查清单

学AI大模型的正确顺序，千万不要搞错了

这份完整版的大模型 AI 学习资料已经上传CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

python pip

GESP学习考试必读（（二）、《专治粗心的10道训练题》）

为什么 wemake-django-template 值得每个 Django 开发者学习：3个真实案例分享

IOI竞赛中动态分配计算资源的机器学习优化方案

对话式AI隐私保护：从社交媒体广告困境到技术实践

Hacker‘s Keyboard多语言支持全攻略：覆盖40+种键盘布局

这份完整版的大模型 AI 学习资料已经上传CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【`保证100%免费`】