Langchain-Chatchat CSRF攻击防范知识检索系统-程序员充电站

Langchain-Chatchat CSRF攻击防范知识检索系统

在企业智能化转型的浪潮中，越来越多组织开始部署基于大语言模型（LLM）的本地知识库问答系统。这类系统不仅能将内部文档转化为可交互的知识源，还能通过自然语言接口提升信息获取效率。然而，随着功能增强，安全风险也随之而来——尤其是那些暴露了 Web 接口的本地服务，极易成为跨站请求伪造（CSRF）攻击的目标。

Langchain-Chatchat 作为开源领域中较为成熟的私有知识库解决方案，集成了 LangChain 框架、向量数据库与多种国产化 LLM 支持，广泛应用于企业内网环境。但正因其具备 Web UI 和 API 接口，若缺乏足够的安全防护设计，攻击者可能利用用户已登录的身份执行非授权操作，比如删除知识库、修改配置甚至上传恶意内容。因此，在构建智能的同时，必须同步筑牢安全防线。

当智能遇上漏洞：一个真实的威胁场景

设想这样一个场景：某公司 IT 部门部署了一套 Langchain-Chatchat 系统用于员工自助查询制度文件。管理员登录后可以管理知识库，普通用户只能提问。某天，一位员工无意间点击了一个钓鱼链接，页面看似是“年度福利说明”，实则隐藏着一段自动提交的表单：

<form action="http://intranet:8000/api/delete_knowledge_base" method="POST"> <input type="hidden" name="kb_id" value="1" /> </form> <script>document.forms[0].submit();</script>

由于该员工正处于登录状态，浏览器会自动携带会话 Cookie 向目标接口发起请求。而如果后端没有校验请求的合法性，服务器就会误认为这是管理员的正当操作，直接执行删除逻辑。结果就是整个公司的制度知识库被清空——一次无声无息的破坏就此完成。

这正是典型的CSRF 攻击：不窃取密码，也不破解加密，而是巧妙地“借用”用户的合法身份完成恶意行为。对于像 Langchain-Chatchat 这样拥有敏感操作接口的系统而言，这种攻击成本低、隐蔽性强，一旦失守后果严重。

构建闭环：从文档到回答的技术链条

要理解如何防御这类攻击，首先得看清系统的运行全貌。Langchain-Chatchat 的核心流程本质上是一个“感知-处理-响应”的 AI 工作流，依托于 LangChain 提供的强大抽象能力。

当用户上传一份 PDF 或 Word 文档时，系统并不会立刻让它“能被问”。而是经历一系列标准化处理：

加载：使用PyPDFLoader或Docx2txtLoader解析原始文件；
分块：通过RecursiveCharacterTextSplitter将长文本切分为固定长度的语义单元；
嵌入：调用如 BGE、Sentence-BERT 等中文优化的 embedding 模型，将文本转为向量；
存储：存入 FAISS 或 Chroma 这类轻量级本地向量数据库；
检索+生成：用户提问时，先进行相似度搜索，再将上下文拼接成 Prompt 输入给本地部署的 LLM（如 Qwen-7B、ChatGLM3-6B），最终返回结构化回答。

整个过程可以用如下代码简洁表达：

from langchain.document_loaders import PyPDFLoader from langchain.text_splitter import RecursiveCharacterTextSplitter from langchain.embeddings import HuggingFaceEmbeddings from langchain.vectorstores import FAISS # 加载 & 分割 loader = PyPDFLoader("policy.pdf") docs = loader.load_and_split(RecursiveCharacterTextSplitter(chunk_size=500, chunk_overlap=50)) # 向量化并入库 embedding_model = HuggingFaceEmbeddings(model_name="BAAI/bge-small-zh-v1.5") vectorstore = FAISS.from_documents(docs, embedding_model) retriever = vectorstore.as_retriever(search_kwargs={"k": 3})

这套流程高度模块化，开发者可以自由替换组件。例如换用 Milvus 实现分布式检索，或接入通义千问 API 替代本地模型。但也正因为灵活性高，安全边界容易被忽视——特别是在前后端通信环节。

安全断点在哪？Web 层的风险暴露

尽管数据处理和模型推理都在本地完成，符合“数据不出域”的合规要求，但前端与后端之间的交互仍依赖 HTTP 协议。只要存在可触发状态变更的 POST/DELETE 请求，就为 CSRF 攻击打开了入口。

常见的脆弱点包括：

/api/upload_document：上传新文档
/api/delete_knowledge_base：删除知识库
/api/clear_cache：清除缓存
/api/update_config：修改系统参数

这些接口通常只验证用户是否登录（即是否有有效 session），却不判断请求是否真正由用户主动发起。而现代浏览器的同源策略（Same-Origin Policy）虽然阻止跨域读取响应，却不限制发送请求。这意味着攻击者完全可以诱导浏览器发出 DELETE 请求，即便无法看到结果，也能达成破坏目的。

更危险的是，许多企业为了方便访问，会将此类系统部署在内网直连地址（如http://192.168.1.100:8000），并未启用 HTTPS 或严格访问控制。一旦有人接入同一局域网并构造恶意页面，攻击成功率极高。

如何设防？四种主流方案对比

面对 CSRF 威胁，OWASP 给出了多种推荐防御策略。结合 Langchain-Chatchat 的实际架构，我们评估几种常见方案的有效性：

防御方式	是否推荐	说明
Referer 检查	❌ 不推荐	可被伪造，部分浏览器或代理会剥离 Referer 头
SameSite Cookie	⚠️ 辅助使用	简单易行，但旧版浏览器不支持，不能单独依赖
CSRF Token 校验	✅ 强烈推荐	最可靠的传统方案，适用于表单场景
双提交 Cookie（Double Submit）	✅ 推荐	适合前后端分离架构，无需服务端存储 Token

其中，双提交 Cookie 模式是当前最契合现代 Web 架构的选择，尤其适用于 Langchain-Chatchat 使用 Vue/React + FastAPI 的典型部署模式。

其原理很简单：
服务端生成一个随机 Token，同时写入 Cookie 并要求客户端在请求头中重复提交该值。由于跨域脚本无法读取 Cookie（受同源策略限制），攻击者无法构造出两个一致的 Token，从而阻断攻击链。

实现示例如下（FastAPI 后端）：

from fastapi import FastAPI, Request, HTTPException from fastapi.responses import JSONResponse import secrets app = FastAPI() @app.get("/csrf-token") async def get_csrf_token(request: Request): token = secrets.token_hex(16) response = JSONResponse(content={"detail": "CSRF token set"}) response.set_cookie( key="csrf_token", value=token, httponly=False, # 前端需读取 secure=True, # 仅 HTTPS 传输 samesite="strict" ) return response @app.middleware("http") async def csrf_middleware(request: Request, call_next): if request.method in ["POST", "PUT", "DELETE"]: header_token = request.headers.get("X-CSRF-Token") cookie_token = request.cookies.get("csrf_token") if not header_token or not cookie_token or header_token != cookie_token: raise HTTPException(status_code=403, detail="CSRF token mismatch") return await call_next(request)

前端在每次敏感请求前需先获取 Token，并在后续请求中带上：

// 获取 Token await fetch('/csrf-token', { credentials: 'include' }); // 发起删除请求 const token = getCookie('csrf_token'); // 自定义函数读取 Cookie await fetch('/api/delete_kb', { method: 'POST', headers: { 'Content-Type': 'application/json', 'X-CSRF-Token': token }, credentials: 'include', body: JSON.stringify({ kb_id: 1 }) });

这种方式无需维护服务端状态，扩展性好，且兼容 JWT 认证体系，非常适合微服务化部署。

更进一步：不只是 Token，还有整体安全观

CSRF 防护不是孤立的功能，而是整体安全架构的一部分。即使实现了 Token 校验，仍需注意以下工程细节，否则可能功亏一篑：

1. 必须启用 HTTPS

明文传输会使 Token 被中间人截获。即使是内网部署，也应配置自签名证书 + 内部 CA 信任链，确保通信加密。

2. Cookie 安全属性设置

response.set_cookie( key="csrf_token", value=token, secure=True, # 仅 HTTPS httponly=False, # 允许 JS 读取（前端需要） samesite="strict" # 严格同源，防止 Lax 下的 GET 泄露 )

3. 避免 GET 请求引发状态变更

RESTful 设计原则强调：只有 POST/PUT/DELETE 才能改变状态。若允许GET /delete?kb_id=1，则连 Referer 检查都无效——因为图片标签<img src="...">也能触发。

4. 日志监控与异常告警

对连续失败的 CSRF 校验尝试进行记录，可用于识别扫描行为或内部试探攻击。例如：

[WARN] CSRF mismatch from IP 192.168.1.50, expected: a1b2c3d4, got: x9y8z7w6

5. 结合权限控制系统

Token 只解决“是不是你发的”，不解决“你能不能这么做”。应与 RBAC 权限模型配合，确保即使 Token 正确，也要检查角色是否有权执行操作。

架构视角：四层防护体系

从系统架构角度看，一个健壮的 Langchain-Chatchat 部署应当包含四个层次的安全保障：

graph TD A[用户界面层] -->|HTTPS + X-CSRF-Token| B[Web 服务层] B -->|调用 LangChain 组件| C[AI 处理引擎层] C -->|本地存储| D[数据持久层] style A fill:#eef,stroke:#99f style B fill:#fee,stroke:#f99,stroke-width:2px style C fill:#efe,stroke:#9f9 style D fill:#eef,stroke:#99f subgraph "安全控制点" B --> "CSRF 校验中间件" B --> "身份认证 (Session/JWT)" C --> "RAG 上下文隔离" D --> "文件权限控制" end

在这个模型中，CSRF 防护位于Web 服务层，是抵御外部恶意请求的第一道闸门。它与身份认证、输入过滤、日志审计共同构成纵深防御体系。