news 2026/5/6 0:50:46

【AI编程实战】别再只盯着模型了!2026 年最值得关注的技术是 Harness

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
【AI编程实战】别再只盯着模型了!2026 年最值得关注的技术是 Harness

一、灵魂拷问:你的 AI 工具为什么有时靠谱有时翻车?

你有没有遇到过这种情况——

同一个 Claude Sonnet 模型,在 Claude Code 里跑得飞起,但直接调 API 就开始"胡说八道"?

别人用 OpenClaw 起飞了,你装了同样的工具却频频翻车?

明明用的都是最顶级的模型,产出却天差地别?

别怀疑自己。你差的可能不是模型,是 Harness。


二、什么是 Harness?

模型本身只会生成文本。是 Harness 给了它读文件的能力、写代码的能力、搜索代码库的能力、在终端执行命令的能力。

没有 Harness,Claude 就是一个只会说话的大脑——有智力,没有手脚。

Simon Willison 有一个更精炼的定义:

Coding agent = harness for LLM

这就是 Harness 的本质——它是包裹在 LLM 外围的那一层,让模型从"能说"变成"能做"。


三、行业大辩论:Model 重要还是 Harness 重要?

模型派(Big Model)的观点来自 OpenAI 和 Anthropic:

“All the sauce, it’s all in the model. And this is the thinnest possible wrapper over model. We literally could not build anything more minimal.”
Boris Cherny, Claude Code 产品负责人

Anthropic 一直强调 Claude Code 的 Harness 极简,核心能力都在模型里。

OpenAI 的 Noam Brown 也说过:

“Reasoning models 出现后,很多 Agent 工程的 scaffolding 就不需要了。给 reasoning model 同样的问题,不需要任何 scaffolding,它自己就能搞定。”

Scale AI 的 SWE-Atlas 测试数据似乎也在支持模型派——Harness 的差异在误差范围内:

Opus 4.6: Claude Code vs 通用 SWE-Agent → +2.5 分 GPT 5.2: 通用 SWE-Agent vs Claude Code → +2.5 分

结论:不同模型在不同 Harness 上表现不同,Harness 的选择是"噪声"?

但 Harness 派(Big Harness)不同意。

LangChain 的 Jerry Liu 直言不讳:

“The Model Harness is Everything — the biggest barrier to getting from AI is your own ability to context and workflow engineer themodels.”

LangChain 的实测数据打了模型派的脸:

仅优化 Harness 层的逻辑,在底层模型(Claude Sonnet 4.5)完全不变的情况下,Coding Agent 的任务得分从 52.8 提升至 66.5,行业排名从第 30 名跃升至第 5 名。

Anthropic 官方自己也在认真研究 Harness——他们专门发了《Effective harnesses for long-running agents》,研究如何让 Agent 跨越多个上下文窗口持续工作。

我的判断:

模型重要,Harness 也重要。但两者发力的阶段不同:

模型能力 → 决定能力上限 Harness 工程 → 决定能否逼近上限

Claude Code 年化收入破 10 亿美元——这是一个 Harness 产品的收入,不是模型本身的收入。市场已经给出了答案。


四、Agent = Model + Harness

这是 2026

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/6 0:49:29

Android动态分区实战:从super.img里提取并修改vendor.img的完整流程

Android动态分区深度定制:从super.img提取到vendor.img修改全流程解析 在Android系统定制开发领域,动态分区机制自Android 10引入以来,彻底改变了传统分区管理方式。对于需要深度定制设备固件的开发者而言,掌握super.img的解包与重…

作者头像 李华
网站建设 2026/5/6 0:49:12

【数据分析】实现分数阶混沌系统的混沌特性附matlab代码

✅作者简介:热爱科研的Matlab仿真开发者,擅长毕业设计辅导、数学建模、数据处理、程序设计科研仿真。 🍎完整代码获取 定制创新 论文复现点击:Matlab科研工作室 👇 关注我领取海量matlab电子书和数学建模资料 &…

作者头像 李华
网站建设 2026/5/6 0:46:31

医疗AI角色行为差异研究及临床实践优化

1. 项目背景与核心问题在医疗人工智能领域,临床语言模型的应用正逐渐从辅助诊断向更复杂的医患交互场景延伸。我们发现一个关键现象:当模型被赋予不同医疗角色(如主治医师、住院医师、护士等)时,其生成的临床建议、沟通…

作者头像 李华
网站建设 2026/5/6 0:39:49

LLM提示词编排引擎:模块化设计、动态模板与生产级部署指南

1. 项目概述:为什么我们需要一个提示词编排引擎?如果你和我一样,在过去一两年里深度使用过各种大语言模型,从ChatGPT到Claude,再到本地部署的开源模型,那你一定经历过这样的场景:为了调试一个复…

作者头像 李华
网站建设 2026/5/6 0:39:49

XUnity Auto Translator 终极指南:快速掌握Unity游戏自动翻译

XUnity Auto Translator 终极指南:快速掌握Unity游戏自动翻译 【免费下载链接】XUnity.AutoTranslator 项目地址: https://gitcode.com/gh_mirrors/xu/XUnity.AutoTranslator XUnity Auto Translator 是一款功能强大的Unity游戏自动翻译插件,能够…

作者头像 李华