news 2026/4/18 7:05:24

揭秘 AI 记忆、RAG 演进与自我进化的工程实践!

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
揭秘 AI 记忆、RAG 演进与自我进化的工程实践!

在 2025 年的今天,我们必须承认,当我们要构建一个复杂的 AI 系统时,仅仅会写“你是一个 XX 专家”是远远不够的。我们面临着更本质的系统工程挑战

  • 记忆缺失:Agent 如何像人一样拥有“短期记忆”和“长期记忆”,而不是聊几句就忘?

  • 检索瓶颈:RAG 不仅仅是向量搜索,面对海量非结构化数据,如何解决多租户、低成本与高精度的不可能三角?

  • 认知固化:真正的智能体(AI Scientist)能否在任务执行中“自我反思”并动态更新策略,而不是机械执行?

Context Engineering(上下文工程)正是大模型系统的“RAM”与“前额叶”。

为了确保内容的深度与硬核程度,在AICon 北京站上,我们特邀Zilliz 合伙人 & 研发 VP 栾小凡担任本专题的出品人。作为 LF AI & Data 基金会技术咨询委员会成员,并曾在阿里云(Lindorm)、Oracle 等顶级团队深耕多年的数据库与存储专家,他以其深厚的技术视野,对议题进行了层层甄选与严苛的质量品控,目标只有一个:剔除浅层的 Prompt 技巧,只交付能支撑 AI 系统理解与推理的工程架构。我们最终锁定了来自金山软件、Zilliz、腾讯、灵犀量子的四位技术专家。他们将从信息流转、湖仓一体、Spec-Coding 到动态认知进化,为你拼出一张完整的上下文工程技术地图。

欢迎大家扫码报名,见证 AI 系统架构的代际升级!

1金山软件:Agent 不是传声筒,而是“信息流转”的处理器

架构痛点

目前的很多 Agent 极其脆弱,本质上只是一个“大模型接口的封装”。在面对复杂业务时,它们缺乏对信息的“消化”能力——不知道什么该记入长期记忆,不知道如何组装短期上下文,导致任务执行混乱。

嘉宾解法

金山软件 AI 产品中心应用落地研发负责人陈斌,将从“信息流转的第一性原理”出发,分享 Agent 架构设计的工程规范。

  • 核心观点:Agent 应当从被动的信息处理器,进化为能驱动复杂任务的智能力量。

  • 关键技术:

    • 记忆工程规范:深入拆解External Memory(RAG/ 工具)Working Memory(工作记忆)的划分原理。

    • 长短期记忆调度:探讨在实际业务中,如何平衡记忆检索的“速度”与“深度”,实现信息的高效流转与智能组装。

    • 落地实践:分享在金山办公等真实业务场景中打磨出的上下文构建经验。

2Zilliz:RAG 的下半场,是 Context Engineering 的基础设施

架构痛点

RAG(检索增强生成)已经成为标配,但核心挑战已从“这就跑通”变成了“大规模落地”。如何解决 Long Context 带来的昂贵成本?如何在多租户场景下平衡写入与查询的放大效应?

嘉宾解法

Zilliz 研发总监兼 Milvus 负责人刘力,将带来 Milvus 在 Context Engineering 中的湖仓一体实践。

  • 核心观点:Informational Context 的核心矛盾在于“质量 vs 数量”。RAG 必须进化,解决非结构化数据全生命周期的管理问题。

  • 关键技术:

    • 搜索策略演进:既然单纯的向量搜索不够准,那就引入混合搜索、ColBERT、聚合搜索等新式方法,保证 Context 的“质”。

    • 多租户挑战:揭秘在海量数据下,如何在写入和查询放大间取得平衡,实现性能与成本的最优解。

    • 湖仓一体闭环:展示从 Data Mining 到 Model Training 再到在线服务的非结构化数据生命周期管理方案。

3腾讯:拒绝模糊需求,用“上下文工程 2.0”重构开发流

架构痛点

企业级开发中最大的内耗来自“需求模糊”和“协作断层”。AI 辅助编程如果只是补全代码,无法解决核心的工程一致性问题。如何让 AI 理解整个项目的“上下文”?

嘉宾解法

腾讯资深技术产品专家汪晟杰将带来 CodeBuddy 的落地实战,提出 “Spec-Coding”的新范式。

  • 核心观点:上下文工程 2.0 是将“需求→规则→实现”打通为可闭环链路。

  • 关键技术:

    • Spec-Coding 引擎:利用SpecKit将自然语言需求结构化为任务、约束与验收标准。

    • 自动化闭环:也就是Rule Engine + Context Orchestrator。AI 不再是瞎写代码,而是基于工程规则库自动拆解任务、生成代码并执行测试。

    • 实效数据:实践表明,该方案可使开发周期缩短 30%~50%,显著降低缺陷密度。

4灵犀量子:迈向 AI Scientist,智能体的“自我进化”之路

架构痛点

通用大模型在面对医学科研等高度专业、长周期的任务时,往往表现出“知识固化”和“规划脆弱”。静态的 Prompt 无法应对动态的科研探索,AI 需要像科学家一样,从失败中学习。

嘉宾解法

灵犀量子医疗科技总经理王则远博士,将分享一种前沿的 AI Scientist 架构,聚焦于“动态上下文优化”。

  • 核心观点:从In-Context Learning进化到In-Task Learning。建立一个随任务进程自适应更新的“行动手册”。

  • 关键技术:

    • “模式探索 - 过程反思”双循环:这是一个元认知系统。在线挖掘高价值行动模式,离线对失败路径进行因果归因(Process Reflection)。

    • 动态重规划:规划器(Planner)不再是一次性的,而是根据环境反馈进行局部路径的动态调整与剪枝。

    • 工具接地(Tool Grounding):AI 不再是简单调用 API,而是理解工具的副作用与参数语义,实现真正的 Tool Manipulation。

5结语

从金山的信息流转架构,到 Zilliz 的数据底座;从腾讯的研发效能落地,到灵犀量子的前沿认知探索

这四场演讲,代表了 Context Engineering 在不同维度的技术实践。如果你关注如何构建可信赖、可扩展、可控的复杂 AI 系统,这一场论坛绝对不容错过。👇 扫码报名,见证 AI 系统架构的代际升级。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/18 3:46:14

【开题答辩全过程】以 基于Java的影视会员管理系统为例,包含答辩的问题和答案

个人简介一名14年经验的资深毕设内行人,语言擅长Java、php、微信小程序、Python、Golang、安卓Android等开发项目包括大数据、深度学习、网站、小程序、安卓、算法。平常会做一些项目定制化开发、代码讲解、答辩教学、文档编写、也懂一些降重方面的技巧。感谢大家的…

作者头像 李华
网站建设 2026/4/17 22:50:06

LobeChat公众号昵称创意生成

LobeChat:打造专属AI助手的开源门户 在AI技术加速渗透日常工作的今天,越来越多的团队和个人开始构建自己的“数字员工”——那些能写代码、读文档、答问题、做翻译的智能助手。然而,面对OpenAI、Claude等主流服务的数据隐私顾虑与高昂成本&am…

作者头像 李华
网站建设 2026/4/15 5:56:28

NVIDIA没想到会间接干掉中国中低端手机,AI横扫一切!

NVIDIA是AI芯片的龙头,随着AI越发火热,如今它开始间接影响到手机行业,那就是内存,普遍认为中低端手机明年的内存将大幅度缩水,这就让中低端手机更难用了,甚至这些中低端手机可能彻底没人买了!国…

作者头像 李华
网站建设 2026/4/18 7:01:22

Mem Reduct内存管理终极指南:解决电脑卡顿的完整教程

您是否经常遇到电脑运行缓慢、程序响应迟钝的问题?Windows系统内存管理不当是导致这些问题的常见原因。Mem Reduct作为一款轻量级实时内存管理工具,能够有效监控和清理系统内存,实现系统加速和性能优化。 【免费下载链接】memreduct Lightwei…

作者头像 李华
网站建设 2026/4/18 0:17:49

数字记忆守护者:Speechless微博备份实践手册

数字记忆守护者:Speechless微博备份实践手册 【免费下载链接】Speechless 把新浪微博的内容,导出成 PDF 文件进行备份的 Chrome Extension。 项目地址: https://gitcode.com/gh_mirrors/sp/Speechless 还记得那些在微博上记录的美好瞬间吗&#x…

作者头像 李华
网站建设 2026/4/18 5:35:21

终极图像压缩解决方案:Compressor.js让你的网站加载速度翻倍

终极图像压缩解决方案:Compressor.js让你的网站加载速度翻倍 【免费下载链接】compressorjs compressorjs: 是一个JavaScript图像压缩库,使用浏览器原生的canvas.toBlob API进行图像压缩。 项目地址: https://gitcode.com/gh_mirrors/co/compressorjs …

作者头像 李华