我去年帮一个客户做AI客服。
上线第一个月,效果惊艳。80%的问题自动解决,客服团队从10人减到3人,老板很满意,在群里发了红包。
第三个月,问题开始冒头。
客户投诉:“你们AI客服怎么老是给我推荐过期产品?”
查了下原因,Agent的知识库还是三个月前的版本。新产品上线了,它根本不知道。
到了第五个月,更离谱。
一个客户问退款政策,Agent回答的是去年的规则。客户按它说的操作,结果退不了,投诉到消协。
老板把我叫去:“不是部署好了吗?”
我说:“部署好了。但没人养。”
一、Agent不是软件,是"会变质的食材"
传统软件部署完,行为是固定的。输入A,输出永远是B,就像一台机器,你不需要每天给它加油。
Agent不一样。它是概率性的。同样的输入,每次输出可能不同。它的知识会过时,它的判断会漂移,它的边界会模糊。
更麻烦的是,它不会主动告诉你"我搞不定了"。
Klarna的CEO在2025年公开承认:"追求效率导致了服务质量的急剧下降。"他们2023年高调宣布AI处理75%客服对话,裁掉700人。2025年上半年客户满意度暴跌22%,净亏9900万美元,不得不重新招人。
为什么?因为没有人"养"那个Agent。
知识库三个月没更新。业务规则变了,Agent还在按老规矩回答。复杂争议、退款处理、敏感问题——这些需要人工判断的场景,Agent统统给通用回复。
Agent不是部署完就能永远运行的机器。它更像一个永远不会主动举手说"我搞不定"的新员工。你不管它,它就自己瞎干。
二、"养Agent"到底要花多少钱?
很多人算AI投入,只算 deployment 成本:模型调用费、服务器、开发人力。
但真正的成本在 maintenance。
帮一个客户算过账。一个中等复杂度的客服Agent,年维护成本如下:
| 项目 | 成本 | 说明 |
|---|---|---|
| 知识库更新 | ¥8-12万/年 | 产品/政策/FAQ变更,需专人维护 |
| Prompt调优 | ¥6-10万/年 | 持续优化,处理边界Case |
| 质量监控 | ¥5-8万/年 | 人工抽检+自动监控,识别幻觉和漂移 |
| 边界定义 | ¥3-5万/年 | 什么场景必须转人工,规则持续更新 |
| 应急响应 | ¥2-4万/年 | Agent失控时的关停和修复 |
| 合计 | ¥24-39万/年 |
这还不包括模型调用费和服务器。
对比一下:省掉的人力成本是多少?一个客服年薪¥8-10万,裁掉7人,省¥56-70万。
看起来是赚的。
但前提是Agent能稳定处理75%的对话。如果因为维护不到位,客户满意度下降,客户流失,品牌受损——这些隐性成本算了吗?
Klarna的9900万美元亏损,就是这个账。
三、三种"养Agent的人",你缺哪一种?
Writer 2026年初调查了2400人。97%的高管说去年部署了AI Agent,只有29%说有实质性回报。35%的公司在Agent失控时甚至不知道如何立刻关停。
问题不是技术,是组织没准备好"养"Agent。
海外公司正在浮现三种角色:
第一种:业务翻译官
Klarna重新招人时,岗位不再是"客服代表",而是"AI质量审核员"。他们不懂代码,但懂业务规则。日常工作是审核AI回答、定义转人工场景、在AI给出错误方案时兜底。
核心能力:在AI输出和业务真实需求之间做翻译。
第二种:Agent运维
传统运维看系统挂没挂。Agent运维看输出对不对、有没有幻觉、上下文丢没丢。Gartner预测,未来五年AI Agent将重塑基础设施运维团队的角色。
核心能力:看推理日志,不只是error log。
第三种:超级Agent维护者
Dan Shipper的预测:公司会出现一个"超级Agent",由专门小团队维护,服务整个组织。个人Agent维护成本太高,普通人不想SSH到服务器排查问题。
核心能力:养好一个Agent,让全公司用。
这三种角色有一个共同点:他们的核心能力不是写代码,不是画原型,而是在AI输出和业务需求之间做翻译和兜底。
问题来了:你的招聘网站上,怎么写这个JD?
“需要一个能看懂业务、能读推理日志、能写Prompt、能识别AI幻觉、能在关键时刻兜底的人。”
HR会问:这到底是产品经理、运维工程师还是QA?
答案是:都不是。但都沾一点。目前国内市场上,这种人几乎没有。
四、为什么大多数公司还没意识到?
因为"部署"和"维护"在组织注意力里的权重完全不对等。
75%的高管承认AI战略"更多是对外展示,而非真正的内部方向"。钱花了,公关稿发了,配套的流程、人才和监督机制根本没跟上。
人们把Agent当成传统软件。传统软件部署完确实不需要天天养。版本固定、行为确定、输出可预测。
Agent不一样。它的行为是概率性的,输出会随输入漂移,面对的业务场景在持续演化。
而且随着Agent数量增长,这会变成规模性的管理问题。今天你有1个Agent,一个人兼职盯一下。明天你有20个Agent分布在客服、风控、研报、投放各条线,你就需要一个正式团队、一套正式流程、一个正式职能。
麦肯锡2025年分析50个Agent项目失败案例,排在最前面的因素就是:工程实践中最容易被低估、被跳过、被"等上线再解决"的环节——持续维护。
五、一个快速自检清单
如果你已经部署了Agent,用这5个问题自检:
- 知识库多久更新一次?如果答案是"上次上线时",Agent已经在胡说八道了。
- Agent的回答有人定期抽检吗?不是等用户投诉,是主动抽查。
- 业务规则变了,Agent知道吗?产品迭代、政策调整、价格变动——Agent同步了吗?
- 什么场景必须转人工,定义清楚了吗?不是"复杂的问题",是明确的规则。
- Agent失控时,谁能在10分钟内关停?35%的公司不知道答案。
5个都是"是",Agent才算在"养"。
六、结论
Agent的部署成本只是首付。维护成本才是月供,而且月月不能停。
Klarna的故事不是"AI失败",是"没人养Agent"。技术没问题,AI确实能处理75%的客服对话。问题在于剩下25%没人管,知识库没人更新,边界Case没人定义,质量漂移没人监控。
Agent越强,"养Agent的人"越重要。这不是悖论,这是规律。
如果你今天部署了Agent,但还没想清楚"谁养"——那你不是在省钱,是在预支未来的亏损。
Agent不是冰箱,插上电就能用。它是宠物,需要喂、需要遛、需要清理。你可以不养,但别怪它捣乱。
数据来源说明:本文部分数据引用自 Writer 2026年调研、Gartner 2026年5月报告、McKinsey 2025年分析、Klarna公开财报。案例为行业典型场景,非特指单一客户。
学AI大模型的正确顺序,千万不要搞错了
🤔2026年AI风口已来!各行各业的AI渗透肉眼可见,超多公司要么转型做AI相关产品,要么高薪挖AI技术人才,机遇直接摆在眼前!
有往AI方向发展,或者本身有后端编程基础的朋友,直接冲AI大模型应用开发转岗超合适!
就算暂时不打算转岗,了解大模型、RAG、Prompt、Agent这些热门概念,能上手做简单项目,也绝对是求职加分王🔋
📝给大家整理了超全最新的AI大模型应用开发学习清单和资料,手把手帮你快速入门!👇👇
学习路线:
✅大模型基础认知—大模型核心原理、发展历程、主流模型(GPT、文心一言等)特点解析
✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑
✅开发基础能力—Python进阶、API接口调用、大模型开发框架(LangChain等)实操
✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用
✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代
✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经
以上6大模块,看似清晰好上手,实则每个部分都有扎实的核心内容需要吃透!
我把大模型的学习全流程已经整理📚好了!抓住AI时代风口,轻松解锁职业新可能,希望大家都能把握机遇,实现薪资/职业跃迁~