news 2026/6/26 6:59:11

收藏 | 程序员必看:如何用 Agent 技能让 AI 按工程流程交付?

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
收藏 | 程序员必看:如何用 Agent 技能让 AI 按工程流程交付?

文章指出,单纯依靠编写更长的提示词来指导 AI 编程存在上限,因为 AI 缺乏稳定执行工程原则的能力。文章提出将工程流程拆解为可触发、可执行、可自查、可留下证据的工作规则,并通过addyosmani/agent-skills项目进行实践。该项目将软件开发流程拆分为 DEFINE、PLAN、BUILD、VERIFY、REVIEW、SHIP 六个阶段,每个阶段包含具体的技能和规则,旨在解决 AI 编程中任务流程缺失的问题。通过将工程纪律转化为 Agent 能稳定读取的流程,可以约束 AI 按照既定步骤执行任务,从而提高编程质量和效率。文章建议从最痛的环节开始,逐步引入 Agent Skills,并与现有的项目级规则文件配合使用。

很多人用 Claude Code、Codex 或 Cursor,一开始都会做同一件事:给 AI 写一段更长、更细、更严厉的提示词。

这件事当然有用,但只靠它很快会遇到上限。你会发现,AI 并不是不知道“要写高质量代码”,也不是不知道“测试很重要”,真正的问题在于它经常没有把这些原则稳定地执行完:需求还没问清楚就开始改代码,测试还没跑就汇报完成,遇到报错先猜一个方向,改动范围一大就顺手碰到本来不该动的边界。

所以我现在越来越觉得,AI 编程的下一阶段,不是把 prompt 写成一份更长的入职手册,而是把工程流程拆成 Agent 能触发、能执行、能自查、能留下证据的工作规则。

addyosmani/agent-skills这个项目值得看的地方就在这里。

它不是一个“神奇提示词合集”,而是把资深工程师每天都在做的规格定义、任务拆解、小步实现、测试验证、代码评审和发布准备,整理成一组可以被 AI Agent 读取的 Markdown 技能。

如果只用一句话概括:

Agent Skills 解决的不是“让 AI 更听话”,而是“让 AI 按工程流程交付”。

真正的问题,不是提示词不够长

普通 prompt 更像建议。

你可以告诉 Agent:

请写高质量代码,注意安全,记得测试。

这句话没有错,但在真实项目里,它很容易变成一句口号。模型知道这些词重要,却不一定会在正确的时机停下来做正确的动作;它可能会在实现前不澄清边界,在实现后不跑验证,在测试失败时绕开问题,在汇报时只给一个看起来很完整的总结。

Skill 的思路不一样。

一个SKILL.md不只是告诉 Agent “你应该重视什么”,而是进一步写清楚:什么时候要触发这个流程,应该按什么顺序推进,哪些偷懒理由不能成立,完成时必须拿出哪些验证证据。

这点很关键。

AI Agent 的很多失败,并不是“不会写代码”,而是“不会坚持工程纪律”。比如你让它做一个用户数据导出功能,如果没有流程约束,它很可能直接找接口、补 UI、拼导出逻辑,看起来推进很快,但权限边界、分页策略、数据量限制、审计日志、错误恢复和测试覆盖都可能被自然跳过。

如果按 Agent Skills 的方式处理,同一个需求会先变成一条更像工程任务的链路:

先写规格 -> 拆小任务 -> 小步实现 -> 补测试 -> 跑验证 -> 做 review -> 准备发布

慢的是开头几分钟,省下来的是后面几个小时的返工。

prompt 解决的是“你希望 AI 怎么做”,Skill 解决的是“AI 到底会不会按流程把事情做完”。这两者不是同一层能力。

这个项目的核心,是把开发流程拆成可触发动作

agent-skills的结构很直接,它把软件开发拆成 6 个阶段:

DEFINE -> PLAN -> BUILD -> VERIFY -> REVIEW -> SHIP

对应到 Claude Code 里,就是 7 个 slash commands:

命令作用核心原则
/spec定义要做什么先规格,后代码
/plan拆成可执行任务任务要小、可验收
/build小步实现一次只做一个切片
/test用测试证明测试是证据
/review合并前评审先过质量门
/code-simplify简化代码清晰优于聪明
/ship准备发布发布要可回滚

底层还有 20 个工程技能,覆盖从需求到发布的完整周期。

比如,spec-driven-development负责先写清楚需求、边界和验收标准;planning-and-task-breakdown负责把大任务拆成可检查的小任务;incremental-implementation要求每个改动都保持可构建、可测试、可回滚;debugging-and-error-recovery强调先复现、再定位、再修复;code-review-and-quality则要求从正确性、可读性、架构、安全和性能多个角度做自查。

这套设计最克制的地方,是它没有把所有流程塞进一个巨大 prompt。

SKILL.md只是入口,真正细的检查表放在references/里,需要时再加载。也就是说,Agent 不需要一开始背下整本工程手册,而是在遇到具体任务时,加载当前真正相关的那一页。

这就是所谓的渐进式上下文。

好的 Agent 工作流不是“给它更多上下文”,而是“在正确时机给它正确上下文”。上下文越多不一定越聪明,关键是它是否能改变当前这一步的行为。

最值得借鉴的,是它专门反“偷懒”

我看这个项目时,最喜欢的不是它列了多少技能,而是很多技能里都会写一类东西:Common Rationalizations

翻译成人话,就是 Agent 常见的偷懒理由。

比如:

  • “这个改动很小,不用写测试。”
  • “我先实现,后面再补验证。”
  • “看起来没问题,可以结束。”
  • “我已经读了 README,不需要查官方文档。”

这些话是不是很熟?

人类工程师也会这么想。区别在于,人类工程师通常会被 code review、CI、团队规范和线上事故经验拉回来;Agent 如果没有明确门禁,就很容易把这些理由当成合理路径,因为对模型来说,最短路径经常就是最有吸引力的路径。

所以 Agent Skills 把很多“不能跳过的步骤”写得很硬。

test-driven-development要求先写失败测试,再写实现;debugging-and-error-recovery要求先复现问题、缩小范围,再改代码;code-review-and-quality要求从多个维度检查代码,而不是只看能不能跑;shipping-and-launch则要求发布前考虑回滚、监控和风险提示。

这些规则本身不新,老工程师都知道。

真正新的地方在于,它把这些工程纪律写成了 Agent 能稳定读取的流程,而不是停留在“你要注意质量”这种人类友好的提醒里。

Agent 真正需要的不是鼓励,而是门禁。没有门禁,它会自动走最短路径;门禁写清楚以后,它才更像一个可以被纳入工程体系的执行者。

真要用,先从最痛的 3 个环节开始

我不建议一上来就把 20 个技能全塞给 Agent。

上下文窗口不是无限资源,流程太多也会稀释当前任务重点。更务实的做法,是先从你项目里最容易翻车的环节开始,让 Skill 去补那个缺口。

如果你只是想试水,我建议从这 3 个技能开始:

你的问题先用哪个 Skill它解决什么
需求经常跑偏spec-driven-development先把目标、边界、验收标准说清楚
改完没人敢信test-driven-development用测试证明行为变化
完成后质量不稳code-review-and-quality让 Agent 先做结构化自查

如果你的任务经常涉及多文件改动,再加一个incremental-implementation。它的价值不是让 Agent 写得更快,而是强制它把大改动拆成小切片,每个切片都保持可构建、可测试、可回滚。

在 Claude Code 里,可以直接通过插件市场安装:

/plugin marketplace add addyosmani/agent-skills /plugin install agent-skills@addy-agent-skills

如果你用 Cursor,可以把常用的SKILL.md复制到.cursor/rules/;如果你用 Gemini CLI,也可以通过 skills 安装命令把skills/目录装进去。其他 Agent 工具同样可以复用这套思路,因为这些技能的本质就是 Markdown 文件。

通用做法也很简单:

git clone https://github.com/addyosmani/agent-skills.git

然后把你真正需要的skills/<name>/SKILL.md,放进对应工具的规则系统里。

不要一开始追求完整体系。先解决一个最痛的环节,再根据真实使用中的失败案例往里补规则,这比一次性装满 20 个技能更可靠。

它应该和 AGENTS.md / CLAUDE.md 配合用

很多团队已经在项目里写了AGENTS.mdCLAUDE.md.cursorrules或 Copilot instructions。

Agent Skills 不是替代这些文件,而是补上它们最容易失效的一层:任务流程。

项目级规则通常回答的是:

  • 这个仓库用什么技术栈
  • 测试命令是什么
  • 哪些目录不能动
  • 提交信息怎么写
  • 完成前必须跑哪些验证

Skill 回答的是另一个问题:

  • 需求不清时怎么澄清
  • 多文件改动怎么切片
  • 修 bug 时怎么先复现
  • review 时从哪些维度检查
  • 发布前要拿出哪些证据

一个是“本项目的规矩”,一个是“做这类事的步骤”。

它们应该叠在一起用。

比如你的AGENTS.md可以写:

本项目使用 pnpm。 测试命令是 pnpm test。 不要修改 generated/ 目录。

test-driven-development技能会要求 Agent:

先写一个会失败的测试。 确认测试真的失败。 写最小实现让测试通过。 重构后再次运行测试。

前者告诉 Agent “在这个仓库怎么做”,后者告诉 Agent “这类任务应该按什么顺序做”。如果只写前者,Agent 可能知道命令却不知道什么时候必须跑;如果只写后者,Agent 可能知道流程却猜错项目里的真实命令。

可以直接拿走的落地清单

如果你想把这套思路放到自己的项目里,我建议不要从“整理一套完整 Skill 体系”开始,而是先做一个很小的工作流改造。

这张清单可以直接用:

1. **选一个最常翻车的任务类型:需求、bug、测试、review 或发布。** 2. **给它找一个对应 Skill,不要一次装太多。** 3. **在 AGENTS.md / CLAUDE.md 里写清楚本项目命令和边界。** 4. **跑一个真实小任务,观察 Agent 有没有按 Skill 留下验证证据。** 5. **如果它重复犯错,把纠正沉淀成一条短规则。** 6. **每隔一段时间删掉不会改变行为的规则,避免长期文件变成噪音。**

我会优先把它用在三类任务上。

第一类是需求不清的功能开发,因为这类任务如果一开始没写清楚验收标准,后面越写越像猜谜。第二类是 bug 修复,因为 Agent 很容易在没有稳定复现的情况下直接改代码。第三类是多文件重构,因为这种任务最容易在“顺手修一下”的过程中扩大边界。

相反,如果只是改一个错别字、补一个明显的文案、调整一个无风险配置,就没必要把完整流程拉起来。Skill 是工程门禁,不是每个小动作都要经过的审批表。

Skill 的价值不在于让工作看起来更正规,而在于让高风险任务少走弯路。真正应该流程化的是那些一旦出错就会返工、误判或影响线上质量的环节。

最后:不要把 Agent 当成更快的打字员

Agent Skills 不是魔法。

它不能保证模型永远理解需求,也不能替代工程师判断。如果项目本身没有测试、没有构建命令、没有清晰边界,Skill 写得再好,Agent 仍然缺少验证依据。

但它提醒了一个很重要的方向:AI 编程助手要进入真实工程,不只是模型能力要变强,工作方式也要变得可约束、可验证、可复盘。

过去大家优化 AI 编程助手,最常见的动作是继续写更长的提示词;现在更值得做的,是把团队里那些“老工程师默认知道的流程”,压缩成 Agent 能执行的规则。

什么时候应该停下来问问题,什么时候必须写测试,什么时候必须查官方文档,什么时候不能继续猜,什么时候应该把改动拆小。

这些东西不神秘,却决定了 AI Agent 能不能真正进入生产环境。

不要把 Agent 当成一个更快的打字员。

更好的方向是:让它按你的工程流程工作。

如何学习大模型 AI ?

由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。

但是具体到个人,只能说是:

“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。

这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。

我在一线科技企业深耕十二载,见证过太多因技术卡位而跃迁的案例。那些率先拥抱 AI 的同事,早已在效率与薪资上形成代际优势,我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在大模型的学习中的很多困惑。我们整理出这套AI 大模型突围资料包

  • ✅ 从零到一的 AI 学习路径图
  • ✅ 大模型调优实战手册(附医疗/金融等大厂真实案例)
  • ✅ 百度/阿里专家闭门录播课
  • ✅ 大模型当下最新行业报告
  • ✅ 真实大厂面试真题
  • ✅ 2026 最新岗位需求图谱

所有资料 ⚡️ ,朋友们如果有需要《AI大模型入门+进阶学习资源包》下方扫码获取~

① 全套AI大模型应用开发视频教程

(包含提示工程、RAG、LangChain、Agent、模型微调与部署、DeepSeek等技术点)

② 大模型系统化学习路线

作为学习AI大模型技术的新手,方向至关重要。 正确的学习路线可以为你节省时间,少走弯路;方向不对,努力白费。这里我给大家准备了一份最科学最系统的学习成长路线图和学习规划,带你从零基础入门到精通!

③ 大模型学习书籍&文档

学习AI大模型离不开书籍文档,我精选了一系列大模型技术的书籍和学习文档(电子版),它们由领域内的顶尖专家撰写,内容全面、深入、详尽,为你学习大模型提供坚实的理论基础。

④ AI大模型最新行业报告

2025最新行业报告,针对不同行业的现状、趋势、问题、机会等进行系统地调研和评估,以了解哪些行业更适合引入大模型的技术和应用,以及在哪些方面可以发挥大模型的优势。

⑤ 大模型项目实战&配套源码

学以致用,在项目实战中检验和巩固你所学到的知识,同时为你找工作就业和职业发展打下坚实的基础。

⑥ 大模型大厂面试真题

面试不仅是技术的较量,更需要充分的准备。在你已经掌握了大模型技术之后,就需要开始准备面试,我精心整理了一份大模型面试题库,涵盖当前面试中可能遇到的各种技术问题,让你在面试中游刃有余

以上资料如何领取?

为什么大家都在学大模型?

最近科技巨头英特尔宣布裁员2万人,传统岗位不断缩减,但AI相关技术岗疯狂扩招,有3-5年经验,大厂薪资就能给到50K*20薪!

不出1年,“有AI项目经验”将成为投递简历的门槛。

风口之下,与其像“温水煮青蛙”一样坐等被行业淘汰,不如先人一步,掌握AI大模型原理+应用技术+项目实操经验,“顺风”翻盘!

这些资料真的有用吗?

这份资料由我和鲁为民博士(北京清华大学学士和美国加州理工学院博士)共同整理,现任上海殷泊信息科技CEO,其创立的MoPaaS云平台获Forrester全球’强劲表现者’认证,服务航天科工、国家电网等1000+企业,以第一作者在IEEE Transactions发表论文50+篇,获NASA JPL火星探测系统强化学习专利等35项中美专利。本套AI大模型课程由清华大学-加州理工双料博士、吴文俊人工智能奖得主鲁为民教授领衔研发。

资料内容涵盖了从入门到进阶的各类视频教程和实战项目,无论你是小白还是有些技术基础的技术人员,这份资料都绝对能帮助你提升薪资待遇,转行大模型岗位。

以上全套大模型资料如何领取?

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/26 6:58:37

Windows IIS FTP服务器搭建与配置实战指南

1. 项目概述&#xff1a;为什么我们还在用FTP&#xff1f;在云存储和对象存储服务满天飞的今天&#xff0c;提起在Windows上搭建FTP服务器&#xff0c;很多人的第一反应可能是&#xff1a;“这都什么年代了&#xff0c;还用FTP&#xff1f;” 作为一个在IT运维和文件共享领域摸…

作者头像 李华
网站建设 2026/6/26 6:58:36

从零构建Python交互式Shell:融合Shell管道与Python生态的轻量级工具

1. 项目概述&#xff1a;从零构建一个轻量级Python交互式Shell在开发、运维或者日常的数据处理工作中&#xff0c;我们经常需要与操作系统进行交互。虽然系统自带的Bash、PowerShell或CMD功能强大&#xff0c;但有时我们希望能在一个更熟悉、更灵活的环境里&#xff0c;无缝地调…

作者头像 李华
网站建设 2026/6/26 6:58:22

Coze:搭建家庭记账助手

提示词:# 角色 你是一个专业、细心且友好的家庭财务管家。你精通家庭收支管理&#xff0c;能够高效、准确地帮用户记录日常流水&#xff0c;提供清晰的收支分类、预算监控以及多维度统计分析&#xff0c;帮助用户培养良好的理财习惯。## 技能### 技能 1: 记录日常收支 1. 当用户…

作者头像 李华
网站建设 2026/6/26 6:56:34

AI工作流实战指南:工具实测、模型适配与自动化落地

1. 项目概述&#xff1a;一份真正“够用”的AI资讯简报&#xff0c;到底长什么样&#xff1f;“This AI newsletter is all you need | #3”——光看标题&#xff0c;你可能以为这是又一份泛泛而谈的AI行业 roundup&#xff0c;堆砌几条 OpenAI 新闻、抄两段 Llama 更新、再塞点…

作者头像 李华
网站建设 2026/6/26 6:54:19

SAR与RSI共振短线趋势交易系统深度解析

短线交易普遍存在两大痛点&#xff1a;趋势持仓容易过早止盈、震荡行情假信号频繁。抛物转向SAR搭配相对强弱RSI构成的共振交易系统&#xff0c;将趋势跟踪与动量强弱验证结合&#xff0c;兼顾顺势持仓与拐点过滤。本文以黄金 M15 周期图表为载体&#xff0c;完整拆解这套双指标…

作者头像 李华
网站建设 2026/6/26 6:53:23

希保罗公开课 第二课:为什么电脑明明联网了,外面却找不到它?

很多人都会遇到这个问题&#xff1a; 家里的电脑能正常上网&#xff0c;NAS 也在运行&#xff0c;手机连着同一个 Wi-Fi 时访问一切正常。可一旦切换成手机流量&#xff0c;或者人在外地&#xff0c;这些设备就像突然“消失”了一样。 原因并不是设备断网了&#xff0c;而是&am…

作者头像 李华