CLAUDE.md：一个Markdown文件将AI编程返工率从41%降到11%

AI编程的甜蜜陷阱：效率起飞但返工不断

用Claude或Cursor写代码，效率确实起飞。但很多开发者都有同感：AI写出来的代码经常是一场灾难——它会凭空假设你的需求然后自信地执行，把100行能搞定的事写成1000行的臃肿架构，甚至偷偷删掉它看不懂的代码。

然而，一个只有几十行的Markdown文件，正在改变这一切。这个文件叫CLAUDE.md，在GitHub上已获得超过14万Star。它背后的核心思想来自OpenAI创始成员、前特斯拉AI总监Andrej Karpathy的深度观察，由开发者张家源整理成可执行的工程规范。

关于Karpathy： Andrej Karpathy是深度学习领域最具影响力的实践者之一。他是OpenAI的联合创始成员，曾主导GPT系列早期研究；后加入特斯拉担任AI和自动驾驶视觉总监，主导了特斯拉神经网络感知系统的构建。他以"用工程师语言解释AI"著称，其斯坦福CS231n课程被全球数百万开发者学习。Karpathy对AI编程的观察尤为深刻，因为他既是顶级AI研究者，也是大规模工程系统的实际构建者——这种双重视角让他能精准识别AI辅助编程中"能力强但不可控"的结构性矛盾。

CLAUDE.md文件

Karpathy总结的AI编程三大致命问题

Karpathy指出，现在AI编码的错误已经不是简单的语法错误了，而是三个更深层的系统性问题。

问题一：错误假设——AI不问就干

模型会做出错误假设，然后不假思索地执行。它不管理自身的困惑，不寻求澄清，不呈现矛盾，不展示权衡。比如你说"添加用户验证"，AI可能默认你想要一个完整的OAuth系统，而不会问你：是想要简单的邮箱验证，还是复杂的第三方登录？

问题二：过度复杂化——100行变1000行

AI真的很喜欢把代码搞复杂。它堆砌抽象概念，不清理死代码，明明100行能搞定的事非要实现成1000行的臃肿架构。你最后得到的是一个过度设计的怪物——代码难以维护、难以理解、难以修改。

这种倾向并非随机错误，而是训练数据分布的必然结果。大语言模型在预训练阶段大量学习了GitHub上的开源代码库，而这些代码库存在显著的"展示偏差"——开发者倾向于提交经过精心设计、包含完整抽象层和错误处理的代码，而非简单的一次性脚本。模型因此学到了一个隐性规律："复杂=专业=正确"。此外，RLHF（基于人类反馈的强化学习）阶段的标注者往往也会给功能更完整的代码打更高分。这种训练偏差导致AI在面对简单需求时，会系统性地高估所需的工程复杂度。

问题三：无关编辑——偷偷改你没让它改的代码

AI有时会改动或删除自己理解不足的代码和注释，即使这些内容与当前任务本身无关。结果代码审查变成噩梦，因为你根本分不清哪些改动是必要的，哪些是AI"顺便"做的。

代码审查中的困惑

这三个问题的根源是什么？AI缺乏一个明确的行为准则。 它不知道你的工程哲学是什么，不知道什么叫"足够好"，只知道一个方向——尽可能多地生成代码。

CLAUDE.md的四条黄金规则

张家源的解决方案很直接：与其试图改进AI模型本身，不如给AI一个明确的行为准则。这四条规则直接对应Karpathy发现的三大问题。

CLAUDE.md的技术机制： Claude Code在启动时会自动扫描项目根目录，将CLAUDE.md的内容注入到对话的系统提示（System Prompt）层。这意味着文件内容会占据模型上下文窗口（Context Window）的最高优先级位置，在每次对话开始前就已生效。现代大语言模型的上下文窗口通常在10万到20万token之间，系统提示的内容会对模型的整个响应风格产生持续性影响。这也解释了为什么CLAUDE.md越简短越有效——过长的规则会稀释每条指令的权重，而精炼的约束能让模型更稳定地遵守。这一机制同样适用于Cursor的.cursorrules文件和GitHub Copilot的自定义指令。

规则一：编码前先思考

核心原则：不要假设，不要隐藏困惑，呈现权衡。

这条规则直接解决"错误假设"问题，强制AI在动手之前明确说出它的理解：

明确说明假设，如果不确定就询问而不是猜测
呈现多种解释，当存在歧义时不要默默选择一种
如果存在更简单的方法，主动说出来
困惑时停下来，指出不清楚的地方并要求澄清

比如你说"优化这个函数"，没有CLAUDE.md规则时AI会默认加上缓存、并发、监控。有了规则后，AI会先问：你说的优化是指速度、内存还是可读性？现在的瓶颈在哪里？

规则二：简洁优先

核心原则：用最少的代码解决问题，不要过度推测。

这条规则直接对抗AI的过度复杂化倾向，本质上是在用显式约束对抗隐性的训练偏见：

不要添加要求之外的功能
不要为一次性代码创建抽象
不要为不可能发生的场景做错误处理
如果200行代码可以写成50行，重写它

这条规则强制AI问自己一个问题：资深工程师会觉得这过于复杂吗？ 如果答案是"是"，那就重写。

规则三：精准修改

核心原则：只碰必须碰的，清理自己造成的混乱。

编辑现有代码时，不要改进相邻的代码、注释或格式
不要重构没坏的东西
匹配现有风格，即使你更倾向于不同的写法
如果注意到无关的死代码，提一下但不要删除它

关键标准是：每一行修改都应该能直接追溯到用户的请求。

规则四：目标驱动执行

核心原则：定义成功标准，循环验证直到达成。

这条规则把指令式的任务转化为声明式的目标——你不再说"做这个"，而是说"达到这个状态"。这一区别在软件工程中有深远意义：指令式方式告诉AI"做什么步骤"，声明式方式告诉AI"达到什么状态"。这与现代基础设施领域的演进方向高度一致——Kubernetes、Terraform等工具的核心设计哲学正是声明式配置：你描述期望的终态，系统自己决定如何到达。

AI非常擅长循环执行直到达成特定目标，给它一个明确的、可验证的成功标准，它会自己循环、自己调整直到达成。这种模式在AI Agent（智能体）架构中被称为"目标导向规划