news 2026/4/18 3:37:55

【收藏必看】从RAG到AI Agent开发全踩坑指南:3个月实战经验总结

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
【收藏必看】从RAG到AI Agent开发全踩坑指南:3个月实战经验总结

本文分享了作者从RAG到AI Agent开发的3个月实战经验,详细记录了使用FastAPI+OpenSearch+大模型构建Agent系统的踩坑历程,包括环境配置、模型选择、查询优化、提示词调试等关键技术挑战。作者通过对比开源框架与自研方案的优劣,总结出了一套适合业务需求的Agent开发方法论,并揭示了其与推荐系统相似的召回-排序-重排序架构模式,为AI Agent开发者提供了宝贵的实战参考。

2021~2025年开始的大模型疯狂急速迭代,RAG概念问世,还没有尝试,如今AI Agent变得热火朝天,当然也可能火热了很久,只是自己落伍了,才刚开始接触。于是乎也来凑个热闹,尝试一下agent开发。说实话,除了迷茫还是迷茫。这篇可能是非干货水文。

前言

一个项目磨磨唧唧做了几个月,从开始的开源低代码workflow框架(RAGflow、dify),再到后来完全自行开发。之间完全没有感觉到痛苦,有的只有心虚与迷茫。心虚的是担心这个程序上线后崩盘,迷茫的是处处都是坑,哪个坑都没整明白。

系统主要功能:

  1. 采集内容到知识库

  2. 用户提问或提供关键词或句子

  3. 根据2用户提问,搜索知识库中内容

  4. 根据3搜索到知识库中内容,大模型进行总结。

感悟:好像各种类似的项目都可以按照这个逻辑来做,只需要修改知识库、提示词和业务相关的规则。不知道是不是我的错觉【笑】。

环境准备

这里不详细介绍了,全是官网下载安装即可

1、python3.12,Fastapi开发web项目

2、mysql,用于存储元数据,包括用户、预设、配置等等。

3、OpenSearch(或elasticsearch),这俩开源协议貌似有些许差别,向量构建和搜索有区别,其他差不多。

4、一个大模型服务(qwen和deepseek),本地部署或者直接购买厂商服务。

5、ollama,部署本地向量模型bge-m3和意图识别对话小模型qwen3,到ollama官网查看支持具体模型的名字和版本号。

小坑1:ollama对话模型直接命令启动即可,例如:ollama run qwen3。bge-m3是向量模型,不需要启动,执行命令(ollama pull bge-m3)下载模型后,请用如下命令测试是否可用,出现1024维向量即可。GPU机器好贵,用CPU会慢并且会拉满CPU使用率。
curl http://127.0.0.1:11434/api/embed -d '{"model": "bge-m3:567m", "input": ["hello world"]}'
小坑2:如果使用deepseek-r1深度思考模型,json格式化输出遇到了小问题,可能是自己提示词用的不好,json输出很难控制。deepseek-v3和qwen3通过提示词来json格式化输出比较容易。 小坑3:fastapi要不全用同步框架开发,要不都用异步框架。异步接口使用同步方法这种混用后,出现了一个接口卡死了整个服务。这里是自己业务不精了,对python和fastapi框架没有进行深入的学习。

系统架构

看了一些ragflow框架源码。感觉自己做的agent架构太过于朴素,这也是对系统没有信心的原因。不过吧,越简单可能错误越少呢,是不?

  1. 数据服务

    将数据进行清理、结构化、向量化后,写入存储层。

  2. 存储层

    大坑1:大坑是目前没有很好解决的。一是OpenSearch配置合适的数据滚动策略,因为向量数据增长迅速,内存很难无限增大,一部分数据一定会放到磁盘,影响查询速度。二是适合业务的高效准确的查询策略,如何保证查询准确率?主观判别?或客观的验证方法是什么?三是,词、向量和其他筛选条件的权重如何调试平衡,使查询到结果符合业务要求?

  • redis:需要快速读取频繁访问的数据。

  • Mysql:用户、登录、访问等基础信息。

  • OpenSearch(或elasticsearch):数据服务写入结构化数据(文本等)和向量,这是知识库主要存储。

  1. ollama(bge-m3)向量服务

    图片里拼写错了【哭】。bge-m3模型支持多语言,向量1024维,归一化后的,可以直接用于余弦相似度计算。

  2. 接口服务

    选择合适的web开发框架,注意前文的提到的小坑3。比较麻烦的是大模型流式输出,一般是用sse协议,markdown文本格式(目前聊天类服务,如deepseek等,很多用该格式),目前前端展示处理markdown,有成熟框架,大模型生成markdown也很方便。

  3. 大模型服务

选个用着方便的,如deepseek,qwen,豆包等等吧。

小坑4:接口响应速度和并发都是问题,不过问答类,输出内容速度可以慢一点,以使用各种大模型来看,输出慢一点是可以接受的。

踩坑经验

  1. 尝试ragflow

    构建RAG、agent的开源框架,支持workflow,知识库构建,提供api服务。

    不符合当前业务的点:

  • 服务无法横向扩展,提升系统并发。
  • 当前业务场景需要需要新数据提升展示权重,这里做不到。
  • 构建词、语义相似度搜索,再加上一些条件筛选,很难做到。
  1. OpenSearch

    向量存储,占用内存很大,需要调整配置,向量float型转成byte,可以减少3/4用量,尽量把数据放进内存,提升查询速度。从磁盘查询,需要几十秒才能返回结果,用户受不了。

  2. 提示词

    用大模型服务(deepseek等)去生成提示词,生成后,在实际场景中查询使用,再根据结果将原提示词和修改意见再放回大模型服务进行调整。不断循环调试。

  3. 尝试意图识别

    为了获取更好的查询结果和查询速度,首先将用户提问进行意图识别和分类,再执行相应的操作。真的好难。采用向量相似度进行意图识别准确率待验证。使用大模型意图识别会影响接口响应速度,同样有准确率问题,需要调整意图描述和识别意图的提示词。

  4. 无用的小tips

    给自己留的笔记,opensearch的数值(时间、距离、价格等)衰减函数(gauss,lin,exp)参数说明,衰减函数会把给定的origin范围内的数据提升查询分数,更容易展现在眼前。查了官方文档和看了一些博客,一直没看懂,尝试了一下,确定了分数计算方式。

    origin:score=1的点

    offset:origin - offset <= value <= origin + offset,这时候score=1

    scale:

    (1)origin - scale < value < origin - offset 和 origin + offset < value < origin + scale时,score的值按照所选函数衰减(如gauss)

    (2)在value=origin - scale 和value = origin + scale这2个点时,score=decay

    (3)在value < origin - scale 和 value > origin + scale 时,score按照函数衰减(如gauss)

    decay:衰减值

总结

希望项目能迭代几次,得到用户的反馈,能将开发中不明确的问题弄清楚并解决。 在开发过程中感觉特别像曾经接触过的推荐系统,流程如下: 1. 召回:从巨量数据知识库中检索到少量数据,这里是opensearch查询 2. 排序:根据召回结果进行排序,这里是opensearch分数排序,再一次减少数据量 3. 重排序:手写程序规则或重排序模型再次进行排序,获取更少的数据 4. 将最终结果列表给到用户

AI时代,未来的就业机会在哪里?

答案就藏在大模型的浪潮里。从ChatGPT、DeepSeek等日常工具,到自然语言处理、计算机视觉、多模态等核心领域,技术普惠化、应用垂直化与生态开源化正催生Prompt工程师、自然语言处理、计算机视觉工程师、大模型算法工程师、AI应用产品经理等AI岗位。

掌握大模型技能,就是把握高薪未来。

那么,普通人如何抓住大模型风口?

AI技术的普及对个人能力提出了新的要求,在AI时代,持续学习和适应新技术变得尤为重要。无论是企业还是个人,都需要不断更新知识体系,提升与AI协作的能力,以适应不断变化的工作环境。

因此,这里给大家整理了一份《2025最新大模型全套学习资源》,包括2025最新大模型学习路线、大模型书籍、视频教程、项目实战、最新行业报告、面试题等,带你从零基础入门到精通,快速掌握大模型技术!

由于篇幅有限,有需要的小伙伴可以扫码获取!

1. 成长路线图&学习规划

要学习一门新的技术,作为新手一定要先学习成长路线图,方向不对,努力白费。这里,我们为新手和想要进一步提升的专业人士准备了一份详细的学习成长路线图和规划。

2. 大模型经典PDF书籍

书籍和学习文档资料是学习大模型过程中必不可少的,我们精选了一系列深入探讨大模型技术的书籍和学习文档,它们由领域内的顶尖专家撰写,内容全面、深入、详尽,为你学习大模型提供坚实的理论基础(书籍含电子版PDF)

3. 大模型视频教程

对于很多自学或者没有基础的同学来说,书籍这些纯文字类的学习教材会觉得比较晦涩难以理解,因此,我们提供了丰富的大模型视频教程,以动态、形象的方式展示技术概念,帮助你更快、更轻松地掌握核心知识

4. 大模型项目实战

学以致用,当你的理论知识积累到一定程度,就需要通过项目实战,在实际操作中检验和巩固你所学到的知识,同时为你找工作和职业发展打下坚实的基础。

5. 大模型行业报告

行业分析主要包括对不同行业的现状、趋势、问题、机会等进行系统地调研和评估,以了解哪些行业更适合引入大模型的技术和应用,以及在哪些方面可以发挥大模型的优势。

6. 大模型面试题

面试不仅是技术的较量,更需要充分的准备。

在你已经掌握了大模型技术之后,就需要开始准备面试,我们将提供精心整理的大模型面试题库,涵盖当前面试中可能遇到的各种技术问题,让你在面试中游刃有余。

为什么大家都在学AI大模型?

随着AI技术的发展,企业对人才的需求从“单一技术”转向 “AI+行业”双背景。企业对人才的需求从“单一技术”转向 “AI+行业”双背景。金融+AI、制造+AI、医疗+AI等跨界岗位薪资涨幅达30%-50%。

同时很多人面临优化裁员,近期科技巨头英特尔裁员2万人,传统岗位不断缩减,因此转行AI势在必行!

这些资料有用吗?

这份资料由我们和鲁为民博士(北京清华大学学士和美国加州理工学院博士)共同整理,现任上海殷泊信息科技CEO,其创立的MoPaaS云平台获Forrester全球’强劲表现者’认证,服务航天科工、国家电网等1000+企业,以第一作者在IEEE Transactions发表论文50+篇,获NASA JPL火星探测系统强化学习专利等35项中美专利。本套AI大模型课程由清华大学-加州理工双料博士、吴文俊人工智能奖得主鲁为民教授领衔研发。

资料内容涵盖了从入门到进阶的各类视频教程和实战项目,无论你是小白还是有些技术基础的技术人员,这份资料都绝对能帮助你提升薪资待遇,转行大模型岗位。


大模型全套学习资料已整理打包,有需要的小伙伴可以微信扫描下方CSDN官方认证二维码,免费领取【保证100%免费】

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/17 19:04:05

快速掌握MouseClick:5个技巧让你的重复点击自动化

还在为每天重复的鼠标点击操作感到疲惫吗&#xff1f;MouseClick鼠标自动连点器正是你需要的效率工具&#xff01;这款跨平台点击工具能够智能模拟鼠标动作&#xff0c;帮你从繁琐的重复劳动中解放双手&#xff0c;实现工作效率提升。 【免费下载链接】MouseClick &#x1f5b1…

作者头像 李华
网站建设 2026/4/13 9:45:18

揭秘Python密钥生成:从算法原理到实战应用的技术深度解析

揭秘Python密钥生成&#xff1a;从算法原理到实战应用的技术深度解析 【免费下载链接】BCompare_Keygen Keygen for BCompare 5 项目地址: https://gitcode.com/gh_mirrors/bc/BCompare_Keygen 在软件授权验证的领域中&#xff0c;密钥生成技术始终扮演着关键角色。今天…

作者头像 李华
网站建设 2026/4/15 14:06:52

UABEA实战宝典:从零掌握Unity资源处理核心技术

为什么你需要掌握UABEA&#xff1f; 【免费下载链接】UABEA UABEA: 这是一个用于新版本Unity的C# Asset Bundle Extractor&#xff08;资源包提取器&#xff09;&#xff0c;用于提取游戏中的资源。 项目地址: https://gitcode.com/gh_mirrors/ua/UABEA 在游戏开发的世界…

作者头像 李华
网站建设 2026/4/9 7:50:25

layui-vue:重新定义企业级前端开发体验

你是否曾为复杂的前端组件配置而烦恼&#xff1f;是否在寻找一个既能快速上手又能支撑大型项目的解决方案&#xff1f;layui-vue正是为此而生——一个基于Vue 3的企业级UI组件库&#xff0c;让前端开发回归简单高效。 【免费下载链接】layui-vue An enterprise-class UI compon…

作者头像 李华
网站建设 2026/4/18 3:28:15

终极帧率解锁指南:如何突破原神60fps限制实现游戏性能大提升

终极帧率解锁指南&#xff1a;如何突破原神60fps限制实现游戏性能大提升 【免费下载链接】genshin-fps-unlock unlocks the 60 fps cap 项目地址: https://gitcode.com/gh_mirrors/ge/genshin-fps-unlock 想要在原神中体验更流畅的战斗画面和更丝滑的探索过程吗&#xf…

作者头像 李华