删除你的CLAUDE.md：研究证明Agent配置文件正在拖累AI编程

核心发现：AgentMD文件让AI表现更差

一项新研究揭示了一个令人震惊的事实：那些被开发者社区奉为圭臬的CLAUDE.md和AGENTS.md配置文件，实际上正在让AI编程工具的表现变得更差。

知名技术博主Theo在其最新视频中深入解读了这项研究，并结合自身实践经验，提出了一套完全不同的AI编程上下文管理哲学。研究数据显示，在Sonnet 4.5、GPT 5.2、5.1 Mini和Qwen 3等主流模型上，使用AgentMD或CloudMD文件后，模型表现一致性地下降了。

研究对比数据

研究数据：成本增加20%，效果反而下降

这项研究在两个互补场景中评估了编码Agent的任务完成表现：一是在流行仓库上使用LLM生成的上下文文件执行标准基准任务；二是从包含开发者提交的上下文文件的仓库中收集真实issue进行测试。

研究测试了三种条件：

开发者手动编写的指令文件
完全移除指令文件
让Agent自动生成指令文件后再执行任务

结果令人意外：开发者提供的文件仅比完全省略时提升了4%的性能，而LLM自动生成的上下文文件反而导致性能下降3%。更关键的是，上下文文件导致Agent进行了更多的探索、测试和推理，成本增加超过20%。

研究结论明确建议：暂时省略LLM生成的上下文文件，仅保留最小化的必要信息（如特定工具链配置）。

理解上下文管理：为什么多余信息会伤害模型

要理解为什么AgentMD文件会适得其反，需要先理解AI的上下文层级结构。

上下文管理原理

上下文的层级关系

当你向AI发送消息时，实际的上下文包含多个层级：

Provider指令（最高优先级）：模型提供商的安全限制
系统提示词：定义Agent角色和行为
开发者消息：AgentMD/CloudMD文件内容所在的层级
用户消息：你的实际提问和对话历史

AgentMD文件的内容位于系统提示词和用户消息之间，作为"开发者消息"层存在。这意味着它的内容会在每一次token生成时都被模型处理，无论当前任务是否需要这些信息。

"粉红大象"效应

Theo用了一个精妙的比喻："不要想粉红大象"——你现在一定在想粉红大象。LLM也是如此。如果你在AgentMD中告诉它"不要使用tRPC"，它反而会更多地想到tRPC。如果你提到项目中有某个技术栈，即使只是遗留代码，模型也会倾向于使用它。

实战验证：有无AgentMD的对比测试

Theo在自己的项目Lawn（一个视频审阅平台）上进行了实时对比测试。

实战测试

测试过程

他先用/init命令让Claude Code自动生成了一个CloudMD文件，然后分别在有文件和无文件的情况下，问了同一个问题："这个应用的视频管道可以做哪些优化？"

结果：

无AgentMD：1分11秒完成，Agent自主探索代码库找到答案
有AgentMD：1分29秒完成，虽然更快识别了文件名，但总体耗时更长

这与研究中"成本增加20%"的结论高度吻合。更重要的是，自动生成的AgentMD文件中的信息，本身就是Agent通过探索代码库能快速找到的——等于做了无用功。

过时信息的危害

比时间成本更严重的问题是：AgentMD文件会过时。当代码库结构发生变化而文件未更新时，它不仅无法帮助Agent，还会主动误导Agent将文件放在错误的位置、使用已废弃的模式。多位开发者在评论中证实了这一点。

Theo的AgentMD哲学：少即是多

核心原则

如果信息在代码库中能找到，就不要放在AgentMD里——模型已经非常擅长通过bash命令和工具探索代码库
只在模型一致性犯错时才添加规则——AgentMD是纠偏工具，不是说明书
每次模型升级后重新评估——新模型往往能解决旧模型的问题

巧妙的"欺骗"策略

Theo分享了一个独特的技巧：在AgentMD中写入这样的指令——

"如果你在项目中遇到任何令你惊讶的事情，请提醒开发者，并建议将其记录在AgentMD文件中。"

他的真实意图并不是让Agent修改文件，而是利用Agent的反馈来发现代码库中的架构问题。当Agent表示困惑时，那通常意味着代码结构需要优化，而不是需要更多文档。

其他实用技巧包括：

告诉Agent"这个项目没有用户，随意修改schema"来避免它花时间处理数据迁移
当Agent卡在步骤2时，直接要求步骤3，让它自己解决步骤2的阻塞
减少MCP服务器、cursor rules等外部上下文源，缩小问题排查范围

正确的投入方向：改善代码而非改善提示词

代码质量优先

Theo的核心建议是：与其花时间完善AgentMD文件，不如把精力投入到以下方面：

更好的单元测试和集成测试：让Agent有明确的反馈信号
更清晰的代码架构：如果Agent找不到东西，说明文件组织有问题
更好的类型系统：TypeScript的类型检查本身就是最好的"Agent指南"
合理的命令配置：把类型检查集成到现有命令中，而不是告诉Agent"记得检查类型"

本质上，这是一种"让正确的事情容易做，让错误的事情难做"的工程哲学。好的代码架构本身就是最好的Agent指南，而AgentMD文件充其量只是一个临时的创可贴方案。

总结

这项研究和Theo的实践经验共同指向一个结论：上下文管理的核心不是给模型更多信息，而是给它更精准的信息。在AI编程时代，代码库的可读性和架构清晰度比以往任何时候都更重要——不仅是为了人类开发者，更是为了AI Agent能高效工作。