news 2026/5/15 20:29:53

Harness Engineering

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
Harness Engineering

Harness Engineering(ハーネス工程 / 智能体驯化工程),可以理解为:

不是让 AI Agent 更聪明,而是给 AI Agent 设计一套可控、可验证、可持续改进的工作环境。

它关注的是 AI 模型外面的那一整套东西:上下文、工具、规则、测试、CI、权限、反馈循环、代码库文档、自动校验、回滚机制、可观测性

一句话说就是:

Model 负责生成,Harness 负责约束、引导、验证和纠错。

OpenAI 在 2026 年 2 月发布的文章里提到,他们做了一个实验:5 个月内构建并发布了一个内部 beta 产品,代码不是人工手写,而是由 Codex 编写;人类的主要工作从“写代码”转向“设计环境、表达意图、构建反馈循环”。(OpenAI)


1. 它解决的核心问题

以前大家用 AI 写代码,主要问题不是“AI 不会写”,而是:

AI 能写,但不稳定。

常见问题包括:

问题具体表现
上下文不稳定AI 不知道项目真实架构、业务规则、历史约定
结果不可控一次改很多文件,容易引入隐性 bug
反复犯错同一个错误每次都要人工提醒
难以验证AI 觉得自己完成了,但测试、边界条件、业务规则没覆盖
难以规模化单次 prompt 有用,但团队、项目、长期维护时失效
审查成本高人类需要反复 review AI 产物,节省的时间又被检查吃掉

Harness Engineering 的出现,就是为了解决AI Agent 从“能演示”到“能生产落地”之间的可靠性鸿沟


2. 它和 Prompt Engineering 的区别

Prompt Engineering更像是:

“我怎么把一句话写好,让 AI 这次回答更好?”

Harness Engineering更像是:

“我怎么设计一套系统,让 AI 每次都更靠地完成任务?”

区别可以这样看:

对比项Prompt EngineeringHarness Engineering
关注点单次提示词长期工作系统
目标让 AI 回答更好让 AI 稳定交付结果
手段写好 prompt文档、测试、CI、工具、规则、反馈
适用场景问答、生成内容AI 编程、Agent 自动执行、多步骤任务
成熟度偏技巧偏工程体系

所以 Harness Engineering 不是“更高级的提示词”,而是AI Agent 时代的软件工程方法论


3. Harness 具体包括什么

一个典型的 coding agent harness 可以包括这些部分:

1)上下文工程

让 AI 能看懂项目,而不是每次靠你口头解释。

例如:

AGENTS.md ARCHITECTURE.md docs/ product-specs/ design-docs/ exec-plans/ SECURITY.md RELIABILITY.md

OpenAI 的实践里,他们没有把所有规则塞进一个巨大的AGENTS.md,而是让AGENTS.md作为目录入口,把真正的知识沉淀到结构化的docs/里,并通过 lint 和 CI 检查文档是否过期。(OpenAI)

2)工具约束

给 AI 能用的工具,但不能无限制乱用。

比如:

只能通过测试命令验证 只能改指定目录 必须通过类型检查 必须先读架构文档 提交前必须跑 lint 不能直接改生产配置

3)反馈传感器

AI 写完之后,必须有东西告诉它:

“你做得对不对?”

这些东西可以是:

单元测试 集成测试 类型检查 ESLint / Checkstyle 静态代码扫描 安全扫描 覆盖率报告 日志 错误堆栈 浏览器截图 CI 结果

Martin Fowler 站点上的文章把 harness 分成两类控制:Guides / 前馈控制,用于提前引导 AI;Sensors / 反馈控制,用于观察结果并让 AI 自我纠正。(martinfowler.com)

4)自动纠错循环

不是 AI 写完就结束,而是形成:

理解任务 → 制定计划 → 修改代码 → 运行测试 → 读取错误 → 修复 → 再验证

LangChain 的实践里,加入自验证、自检查、trace 分析、middleware 后,在不更换模型的情况下,coding agent 在 Terminal Bench 2.0 上从 52.8 提升到 66.5。(LangChain)

5)知识沉淀机制

每次 AI 犯错,不只是这次改掉,而是要把规则沉淀下来:

AI 忘记跑测试 → 增加 pre-commit hook AI 总是改错目录 → 增加目录边界规则 AI 不理解业务口径 → 增加业务规格文档 AI 重复写坏 SQL → 增加 SQL lint 或示例模板

核心思想是:

不要只是纠正一次错误,而是改造环境,让错误以后更难发生。


4. Harness Engineering 的优势

第一,提升 AI 编程的稳定性

没有 harness 时,AI 像一个很聪明但没有项目经验的新人。

有 harness 后,AI 会被项目规则、测试、文档和工具持续约束。

结果是:

AI 不只是“会写代码”,而是更接近“能按项目标准交付代码”。


第二,减少人工 review 成本

如果每次 AI 写完都需要你从头检查,那效率提升有限。

Harness 的目标是把大量低级检查自动化:

格式问题 → formatter 类型问题 → type checker 重复代码 → static analysis 接口破坏 → contract test 业务流程错误 → acceptance test 安全问题 → scanner

人类 review 的重点就可以从“检查低级错误”转为“判断产品方向、架构设计、业务正确性”。


第三,让 AI Agent 可以执行更长任务

普通 AI 对话适合短任务。

但真实开发经常是:

读需求 → 拆任务 → 改前端 → 改后端 → 改数据库 → 写测试 → 提交 PR → 根据 CI 修复

Harness Engineering 通过上下文、计划文档、任务状态、测试反馈,让 AI 能够完成更长链路的任务。

LangChain 也明确提到,harness 的目标是围绕模型构建系统,优化任务表现、token 效率和延迟等指标,而不仅仅是改 prompt。(LangChain)


第四,让团队经验变成系统能力

以前团队规范可能散落在:

微信群 飞书聊天 Confluence 老员工脑子里 历史代码习惯

AI 是看不到这些的。

Harness Engineering 要做的是把这些知识变成 AI 可读、可执行、可验证的资产:

架构文档 业务规则文档 代码模板 PR 模板 测试模板 lint 规则 CI pipeline 自动化脚本

OpenAI 文章里也强调,从 Agent 视角看,无法进入上下文的 Google Docs、聊天记录、隐性知识,实际上就等于不存在。(OpenAI)


5. 它为什么现在重要

因为 AI 编程正在从Copilot 辅助补全进入Agent 自动执行任务阶段。

过去是:

人写代码,AI 辅助补全

现在逐渐变成:

人定义目标,AI Agent 执行,系统负责验证

这时工程师的核心能力会发生变化:

过去现在 / 未来
自己写每一行代码设计 AI 可执行的任务
记住项目上下文把上下文结构化沉淀
手动检查问题构建自动验证系统
直接修 bug让 Agent 在反馈循环中修 bug
写代码为主设计约束、规则、测试、工具链为主

所以 Harness Engineering 的本质是:

把工程师从“代码劳动力”升级为“AI 工作系统设计者”。


版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/15 20:29:50

ChatGPT对话导出工具:用户脚本实现数据备份与格式转换

1. 项目概述:一个被低估的ChatGPT对话存档利器 如果你和我一样,是ChatGPT的重度用户,那么你一定遇到过这样的困境:在ChatGPT网页端或App里,你和AI进行了一场酣畅淋漓的对话,里面可能包含了精心设计的提示词…

作者头像 李华
网站建设 2026/5/15 20:28:55

国产多模态大模型:视觉-语言对齐技术全解析

国产多模态大模型:视觉-语言对齐技术全解析 引言 在人工智能的浪潮中,从“大语言模型”到“多模态大模型”的演进,标志着AI正从理解文字迈向理解更丰富的世界。其中,视觉-语言对齐技术,正是让机器真正“看懂”图像并“…

作者头像 李华
网站建设 2026/5/15 20:21:52

金蝶云星空 FRP 财务板块 AI 二次开发与系统集成的完整步骤

金蝶云星空 FRP 财务板块 AI 二次开发与系统集成的完整步骤,从立项到上线运维,全部按实战流程拆解,同时重点讲清楚BOS 二次开发怎么上手做。一、整体实施步骤(AI FRP 系统集成)第 1 步:业务需求与流程梳理…

作者头像 李华
网站建设 2026/5/15 20:20:09

HLS.js技术深度解析:解决浏览器端HLS流媒体播放的工程挑战

HLS.js技术深度解析:解决浏览器端HLS流媒体播放的工程挑战 【免费下载链接】hls.js HLS.js is a JavaScript library that plays HLS in browsers with support for MSE. 项目地址: https://gitcode.com/gh_mirrors/hl/hls.js 在现代Web视频应用中&#xff0…

作者头像 李华