Day13:RAG 常见问题 & 调优实战
检索不到内容原因:分块太小、关键词太偏、没做混合检索解决:换递归 / 父子分块、加上 ES 混合检索、做 Query 改写
搜到内容多但答不对原因:检索杂、没重排、没上下文压缩解决:加 Rerank 精筛、压缩冗余文本
大模型总瞎编幻觉原因:参考资料太少、给的上下文太乱解决:补全检索资料、精简上下文、限制模型随意发挥
RAG 调优核心就三步调分块 → 调检索(混合 + 重排)→ 调问句改写
Day14:RAG 项目工程落地要点
文档预处理PDF、Word 先转纯文本,去掉乱码、空格、无效页眉页脚
增量更新不用每次全量重新入库;新增文档单独分块、单独入库,节省资源
版本管理知识库分版本,上线新策略可以灰度测试,不好用随时回退
权限控制不同角色只能看对应文档,RAG 要加文档权限过滤
Day15:RAG 面试总结 & 整体架构收口
RAG 两大核心检索靠谱 + 给到模型的上下文干净
完整工业级流程终极版文档预处理 → 合理分块 → ES 建索引 + 向量入库→ Query 改写 → 混合检索 → Rerank 重排→ 上下文压缩 → 大模型生成 → 日志复盘迭代
RAG 适合谁企业私有文档、法规手册、内部知识库、客服问答
RAG 不适合谁实时热点、创意脑洞、复杂高数推理、纯主观创作
面试必背一句话RAG 本质:先找对资料,再让模型照着资料老实回答,减少瞎编