Harness AI工程化编程：Rules+Skills+Wiki+Changes四层体系实战

AI编程的现实困境：为什么90%的人用不好AI写代码

当前AI编程领域呈现出一种耐人寻味的两极分化：一方面，Anthropic、OpenAI等顶级科技公司已经让AI完成了90%以上的代码编写工作；另一方面，大量开发者在尝试AI编程后又退回到了"古法编程"——纯手写代码的老路子。

问题出在哪里？答案其实很明确：大多数人只会用AI做简单项目，却不知道如何驾驭AI完成真正的企业级开发。

专门给企业做大模型项目的公司

本文基于一位拥有京东、唯品会等大厂架构师背景的技术专家分享，系统介绍如何通过 Harness AI工程化编程 体系，利用 Claude Code 构建 Rules + Skills + Wiki + Changes 四层架构，实现企业级项目的自动化可控开发。

当前AI编程的三种典型模式

从实际调研来看，目前开发者使用AI编程大致可以分为三类，每一类的效率和上限差异巨大。

第一类：碎片式使用——把AI当高级搜索引擎

开发者将一个小功能、小模块或小页面的需求丢给AI大模型，甚至通过豆包等网页端工具生成代码，再手动粘贴回IDE。这种方式本质上是把AI当作一个"高级搜索引擎"，效率提升非常有限，也无法应对复杂项目。

第二类：工具辅助式——有进步但缺乏体系

使用 GitHub Copilot、Claude Code、Cursor 等集成开发工具，在编码过程中获得AI的实时辅助。这种方式比第一类进了一步，但仍然缺乏系统性的工程化思维，遇到复杂业务场景时容易失控。

关于 Claude Code 的技术定位： Claude Code 是 Anthropic 推出的面向开发者的命令行 AI 编程工具，与 Cursor、GitHub Copilot 等工具的核心差异在于其「代理式」（Agentic）工作模式。它不仅能生成代码片段，还能主动读取文件系统、执行终端命令、调用外部工具，并在多步骤任务中保持上下文连贯性。这种架构使其特别适合与 Rules/Wiki 等外部知识体系集成，因为它可以在生成代码前主动检索和参考这些约束文件，而不是依赖单次对话的上下文窗口。

第三类：工程化体系——Harness AI编程的正确姿势

这就是本文要重点讨论的 Harness AI工程化编程——通过建立完整的规则体系和知识架构，让AI在严格约束下完成复杂的企业级项目开发。这是目前已被验证的、能真正释放AI编程生产力的方法。

已经在大量使用AI编程了

小白AI编程的天花板到底在哪里

最近社交媒体上到处都是"产品经理用AI从零开发完整项目""零基础用Claude Code做出牛逼产品"的声音，这让不少专业开发者感到焦虑。但冷静分析后你会发现，这些案例存在明显的局限性：

能做的项目： 简单网页、小型Demo、单一功能产品——业务逻辑简单、技术要求不高。

做不了的项目： 企业级ERP系统、微服务分布式架构、高并发互联网平台——业务复杂度高、技术栈深、系统耦合度强。

微服务与分布式架构的复杂性： 微服务架构将单体应用拆分为多个独立部署的小型服务，每个服务围绕特定业务能力构建。这种架构在提升可扩展性和团队自治性的同时，也引入了分布式系统特有的复杂性：服务间通信的网络延迟与故障处理、分布式事务的一致性保障（CAP定理的权衡）、服务发现与负载均衡、链路追踪与可观测性等。这些问题需要深厚的技术积累才能正确处理，也正是「小白AI编程」无法触及的天花板所在。AI在没有明确约束的情况下，往往会生成在单机环境下运行正常、但在分布式场景下存在竞态条件或数据不一致风险的代码。

不是我不说不能做

核心问题在于：当AI编程过程中遇到一个搞不定的bug时，不懂技术的人与大模型交互几十轮仍然无法解决，项目就会永远卡在那里。而专业开发者即使遇到AI的局限，也能凭借自身技术能力介入修正。

这恰恰说明：AI编程不是要取代开发者，而是要求开发者掌握一套新的工程化方法来驾驭AI。

什么是Harness Engineering（驾驭工程）

"Harness"这个词翻译为中文是"驾驭"或"马具"，Harness Engineering（驾驭工程）的核心理念是：像驾驭马匹一样驾驭AI大模型，让它在可控的轨道上高效工作。

为什么企业级AI编程必须引入Harness Engineering

在实际的AI编程过程中，开发者普遍面临以下四大痛点：

幻觉问题：AI生成的代码看似合理，实则存在逻辑错误或调用了不存在的API
代码规范不统一：AI生成的代码风格与项目现有代码库格格不入
上下文丢失：随着对话轮次增加，AI逐渐"忘记"项目的整体架构和约束条件
质量降级：长时间交互后代码质量明显下滑，出现重复、冗余甚至矛盾的实现

AI幻觉问题的技术根源： 大模型的「幻觉」（Hallucination）问题源于其底层的生成机制。当前主流的大语言模型（LLM）本质上是基于 Transformer 架构的概率预测系统，它通过预测「下一个最可能的 Token」来生成内容，而非真正「理解」代码逻辑。这意味着模型在生成代码时，可能会自信地调用根本不存在的 API、引用错误的函数签名，或者生成语法正确但逻辑错误的实现。在编程场景中，幻觉问题尤为危险，因为错误的代码往往能通过编译，却在运行时引发难以追踪的 Bug。

上下文窗口限制与工程化解法： 大语言模型的「上下文窗口」（Context Window）是指模型在单次推理中能处理的最大 Token 数量。即便是 Claude 3.5 等顶级模型拥有 200K Token 的超长上下文，在真实企业级项目中仍然不够用——一个中型 Java 后端项目的代码量轻松超过百万行。当上下文被填满或对话轮次过多时，模型会出现「遗忘」现象，开始忽略早期的约束条件。Harness 体系的四层架构本质上是一种「外部记忆系统」，通过结构化文件将关键约束持久化，每次调用时按需注入，从工程层面绕过了上下文窗口的物理限制。

Harness AI工程化编程正是为了系统性地解决这些问题而提出的方法论。它不是一个工具，而是一套完整的工程化思维框架。

它是没有接触过的

四层工程化体系架构详解

该体系的核心是 Rules + Skills + Wiki + Changes 四层架构，每一层解决不同维度的问题，层层递进，缺一不可。

Rules（规则层）：给AI划定行为边界

这是整个体系的基础，定义了AI编程必须遵守的硬性约束。具体包括：

代码风格规范（缩进、命名、注释格式等）
命名约定（变量、函数、类、文件的命名规则）
架构模式（分层架构、模块划分标准）
禁止使用的反模式（比如禁止在Service层直接操作数据库连接）

Rules确保AI生成的每一行代码都符合团队和项目的标准，从源头上杜绝"AI写的代码风格乱七八糟