Harness Engineering详解：驾驭AI Agent的底层原理与实战方法

引言：模型不是不够聪明，只是缺乏引导

2026年，各大公司不断推出新的语言模型，但一个被反复验证的事实是：同样的模型，加上几行指令，能力可能天差地别。李宏毅教授在最新课程中，以Google开源的Gemma 4 E2B为例，生动展示了这一点。

Gemma 4 E2B是Google于2025年发布的开源轻量级模型，仅有20亿参数，可在消费级硬件上本地运行。相比GPT-4等主流商业模型估计超过万亿的参数量，这是一个极为"袖珍"的模型。然而，参数量的巨大差距并不意味着任务完成能力的同等差距——Harness Engineering的核心洞见正在于此：模型的"原始智力"与"任务完成能力"之间，存在巨大的工程化空间。这对AI普及化意义深远，意味着开发者无需依赖昂贵的大模型API，通过精心设计的Harness，小模型同样可以胜任复杂的自动化任务。

他给模型布置了一个修复程序Bug的任务——修改 parser.py 中的 ExtractEmail 函数，使其通过 verify.py 的测试。第一次尝试时，模型没有意识到 parser.py 就在同一目录下，直接"幻想"了一个文件内容并声称完成任务。但当加入不到80字的工作指引（如"先查看目录文件""修改前先读取内容""达成标准才算完成"）后，同一个2B模型就能正确地执行 ls、cat、编辑文件、运行验证，顺利完成任务。

这个案例引出了今天的核心主题——Harness Engineering（驾驭工程）。

什么是Harness Engineering？

AI Agent的两大组成部分

AI Agent的概念源于1990年代的人工智能研究，指能够感知环境、做出决策并采取行动以实现目标的自主系统。现代基于LLM的Agent将传统Agent架构与大语言模型的自然语言理解能力结合，形成了全新的技术范式。典型的Agent架构包含四个层次：感知层（接收输入）、记忆层（短期工作记忆与长期知识存储）、规划层（任务分解与策略制定）、行动层（工具调用与环境交互）。

一个AI Agent由两部分构成：一是大型语言模型（LLM）本身，二是围绕LLM的一系列支撑程序和框架——这些"其他东西"现在有了一个统一的名字：Harness（马具）。Harness正是对上述四个层次进行系统性工程化设计的框架，决定了Agent如何协调运作，而非仅仅依赖LLM的自发行为。

Harness这个词的象征意涵很直观：AI是一匹拥有强大力量的马，但你需要马鞍和缰绳来驾驭它。打造这些马具的过程，就是Harness Engineering。

Harness Engineering与Prompt Engineering、Context Engineering的区别

这三个概念有大量重叠，但核心侧重不同：

Prompt Engineering：关注如何措辞单次输入以改变输出（如经典咒语"Think Step by Step"，但随着模型变强，这类技巧的边际效益递减）
Context Engineering：关注如何为模型提供充足的上下文信息，是更系统化、自动化的Prompt Engineering
Harness Engineering：关注如何在多轮对话和工具交互的完整流程中驾驭模型，确保任务最终完成

简言之，Harness Engineering要解决的问题是：如何驾驭模型在多轮互动中把事情做好。

Harness的三大控制维度

一、通过规则控制AI Agent的认知框架

我们可以用人类语言编写的规则来影响模型的"认知框架"，这些规则通常存放在 agents.md 或 claude.md 等固定文件中。每次模型启动时，Harness会强制将这些文件内容注入Prompt，就像让员工在工作前先阅读公司章程。

以OpenClaude为例，它会预设在对话开始前读取 agents.md，其中定义了模型的"灵魂"（soul.md）、记忆存储位置（memory.md）等行为规范。当Claude不再支持OpenClaude时，迁移到Claude官方的CoWork其实非常简单——只需将 agents.md 改名为 claude.md，Agent就能在新Harness上"复活"，行为几乎不变。

研究发现： 今年已有多篇论文系统研究了 agents.md 的效果。一项研究表明，agents.md 能加快模型运作速度，尤其对耗时极长的任务帮助显著。另一项研究则发现，人类编写的 agents.md 并非总能发挥作用，而LLM自己生成的 agents.md 效果往往更差。OpenAI的博客还特别强调：agents.md 不能写成"百科全书"，而应像一张地图——告诉模型去哪里找信息，而非塞入所有信息。

二、通过工具配置限制AI Agent的能力边界

工具的配置直接决定了AI Agent能做什么、不能做什么。OpenClaude运行在本地电脑上，可以任意操作文件和浏览器；而CoWork运行在云端沙盒中，每次挂载目录都需要人类授权——安全性更高，但便利性大打折扣。

他会出一个作文题目

更关键的是，适合人类的工具不一定适合AI模型。SWE-Agent论文（2024年）的实验揭示了几个反直觉的发现。SWE-Agent是普林斯顿大学发布的开创性研究，专注于让AI Agent自主解决GitHub上的真实软件工程问题，并引入了SWE-bench基准测试——包含来自12个主流开源项目的2294个真实Bug修复任务，成为衡量AI编程能力的行业标准。该研究提出的ACI（Agent-Computer Interface）概念，即专为AI设计的人机交互界面，与传统为人类设计的CLI/GUI有本质区别，直接催生了Harness Engineering领域对"AI原生工具设计