删除你的CLAUDE.md:研究证明Agent配置文件正在拖累AI编程

研究表明AgentMD配置文件让AI编程工具表现更差、成本更高
一项新研究发现,开发者常用的CLAUDE.md和AGENTS.md配置文件实际上降低了AI编程工具的表现:开发者手写文件仅提升4%性能,LLM自动生成的文件反而降低3%,且成本增加超20%。技术博主Theo通过实测验证了这一结论,并提出"少即是多"的哲学:只在模型反复犯错时才添加规则,把精力投入改善代码架构、测试和类型系统,而非完善提示词文件。
核心发现:AgentMD文件让AI表现更差
一项新研究揭示了一个令人震惊的事实:那些被开发者社区奉为圭臬的CLAUDE.md和AGENTS.md配置文件,实际上正在让AI编程工具的表现变得更差。
知名技术博主Theo在其最新视频中深入解读了这项研究,并结合自身实践经验,提出了一套完全不同的AI编程上下文管理哲学。研究数据显示,在Sonnet 4.5、GPT 5.2、5.1 Mini和Qwen 3等主流模型上,使用AgentMD或CloudMD文件后,模型表现一致性地下降了。

研究数据:成本增加20%,效果反而下降
这项研究在两个互补场景中评估了编码Agent的任务完成表现:一是在流行仓库上使用LLM生成的上下文文件执行标准基准任务;二是从包含开发者提交的上下文文件的仓库中收集真实issue进行测试。
研究测试了三种条件:
- 开发者手动编写的指令文件
- 完全移除指令文件
- 让Agent自动生成指令文件后再执行任务
结果令人意外:开发者提供的文件仅比完全省略时提升了4%的性能,而LLM自动生成的上下文文件反而导致性能下降3%。更关键的是,上下文文件导致Agent进行了更多的探索、测试和推理,成本增加超过20%。
研究结论明确建议:暂时省略LLM生成的上下文文件,仅保留最小化的必要信息(如特定工具链配置)。
理解上下文管理:为什么多余信息会伤害模型
要理解为什么AgentMD文件会适得其反,需要先理解AI的上下文层级结构。

上下文的层级关系
当你向AI发送消息时,实际的上下文包含多个层级:
- Provider指令(最高优先级):模型提供商的安全限制
- 系统提示词:定义Agent角色和行为
- 开发者消息:AgentMD/CloudMD文件内容所在的层级
- 用户消息:你的实际提问和对话历史
AgentMD文件的内容位于系统提示词和用户消息之间,作为"开发者消息"层存在。这意味着它的内容会在每一次token生成时都被模型处理,无论当前任务是否需要这些信息。
"粉红大象"效应
Theo用了一个精妙的比喻:"不要想粉红大象"——你现在一定在想粉红大象。LLM也是如此。如果你在AgentMD中告诉它"不要使用tRPC",它反而会更多地想到tRPC。如果你提到项目中有某个技术栈,即使只是遗留代码,模型也会倾向于使用它。
实战验证:有无AgentMD的对比测试
Theo在自己的项目Lawn(一个视频审阅平台)上进行了实时对比测试。

测试过程
他先用/init命令让Claude Code自动生成了一个CloudMD文件,然后分别在有文件和无文件的情况下,问了同一个问题:"这个应用的视频管道可以做哪些优化?"
结果:
- 无AgentMD:1分11秒完成,Agent自主探索代码库找到答案
- 有AgentMD:1分29秒完成,虽然更快识别了文件名,但总体耗时更长
这与研究中"成本增加20%"的结论高度吻合。更重要的是,自动生成的AgentMD文件中的信息,本身就是Agent通过探索代码库能快速找到的——等于做了无用功。
过时信息的危害

比时间成本更严重的问题是:AgentMD文件会过时。当代码库结构发生变化而文件未更新时,它不仅无法帮助Agent,还会主动误导Agent将文件放在错误的位置、使用已废弃的模式。多位开发者在评论中证实了这一点。
Theo的AgentMD哲学:少即是多
核心原则
- 如果信息在代码库中能找到,就不要放在AgentMD里——模型已经非常擅长通过bash命令和工具探索代码库
- 只在模型一致性犯错时才添加规则——AgentMD是纠偏工具,不是说明书
- 每次模型升级后重新评估——新模型往往能解决旧模型的问题
巧妙的"欺骗"策略
Theo分享了一个独特的技巧:在AgentMD中写入这样的指令——
"如果你在项目中遇到任何令你惊讶的事情,请提醒开发者,并建议将其记录在AgentMD文件中。"
他的真实意图并不是让Agent修改文件,而是利用Agent的反馈来发现代码库中的架构问题。当Agent表示困惑时,那通常意味着代码结构需要优化,而不是需要更多文档。
其他实用技巧包括:
- 告诉Agent"这个项目没有用户,随意修改schema"来避免它花时间处理数据迁移
- 当Agent卡在步骤2时,直接要求步骤3,让它自己解决步骤2的阻塞
- 减少MCP服务器、cursor rules等外部上下文源,缩小问题排查范围
正确的投入方向:改善代码而非改善提示词

Theo的核心建议是:与其花时间完善AgentMD文件,不如把精力投入到以下方面:
- 更好的单元测试和集成测试:让Agent有明确的反馈信号
- 更清晰的代码架构:如果Agent找不到东西,说明文件组织有问题
- 更好的类型系统:TypeScript的类型检查本身就是最好的"Agent指南"
- 合理的命令配置:把类型检查集成到现有命令中,而不是告诉Agent"记得检查类型"
本质上,这是一种"让正确的事情容易做,让错误的事情难做"的工程哲学。好的代码架构本身就是最好的Agent指南,而AgentMD文件充其量只是一个临时的创可贴方案。
总结
这项研究和Theo的实践经验共同指向一个结论:上下文管理的核心不是给模型更多信息,而是给它更精准的信息。在AI编程时代,代码库的可读性和架构清晰度比以往任何时候都更重要——不仅是为了人类开发者,更是为了AI Agent能高效工作。
相关推荐
观点碰撞Windsurf CEO深度访谈:速度是唯一的护城河
Windsurf CEO Varun Mohan深度访谈,分享AI编程IDE的创业pivot经验、产品构建方法论、异步Agent挑战,以及与Cursor竞争的差异化策略。速度才是创业公司唯一的护城河。
观点碰撞被低估即自由:AI时代的逆向竞争哲学
探讨AI行业中"被低估即自由"的逆向竞争策略。从OpenAI、DeepSeek到Cursor,解析为何低调积蓄力量比站在风口浪尖更具战略优势,以及这一哲学对AI创业者和从业者的深刻启示。
观点碰撞新教工作伦理如何被劫持:从保护工人到压迫工人的演变
哲学家Elizabeth Anderson揭示新教工作伦理如何从保护工人的理想被扭曲为压迫工具。从清教徒的公平商业伦理到新自由主义的复活,深度解析工作伦理的历史演变及其对AI时代劳动关系的启示。