Claude Code一周年:从单一Agent到Agent军团的编程革命

从一年前发布时只有两个人在Slack上点赞,到如今团队里每个人屏幕上都开着Claude Code——Anthropic的AI编程工具在短短一年内经历了怎样的蜕变?近日,Claude Code团队成员进行了一次深度对谈,分享了他们在日常工作中如何使用AI编程、工作流发生了哪些根本性变化,以及对未来的展望。
从单一Agent到"Agent军团":协作模式的质变
一年前,Claude Code刚发布时,团队成员的评价是"对简单的工程任务还挺好用"——这其实是一种委婉的说法,意味着它当时并不够强大。但如今情况已经截然不同。
团队成员描述了当前的工作方式:不再是一个人对一个Agent,而是同时运行数十甚至上千个Agent。一个Agent可以提示另一个Agent,形成树状结构的Agent网络。这种从"单兵作战"到"军团协作"的转变,是过去一年最显著的变化。
其中一个关键理念是:每当Claude犯错,不要只是告诉它做不同的事,而是让它把正确做法写入Claude.md文件或创建一个skill。这样Claude就能持续自我改进,理论上可以无限运行下去。
验证机制:被严重误解的Agent核心能力
团队特别强调了验证(Verification)的重要性,并指出这是一个被广泛误解的概念。
大多数开发者听到"验证"会想到单元测试、Lint检查或类型检查——这些本来就已经自动化了。但Agent层面的验证是完全不同的东西:Agent能不能自己运行它构建的东西?

一个令人印象深刻的例子是:当Opus 4模型发布时,Claude Code能够自己测试自己——它在Bash中打开一个Claude CLI实例,测试自己刚构建的功能。如今这种自我验证已经扩展到iOS模拟器、Android模拟器和桌面应用等多个平台。
团队中有人分享了一个具体案例:他创建了一个"桌面开发skill",教会Claude如何启动本地桌面应用,并通过Computer Use功能点击界面进行交互测试。当遇到环境问题时,Claude甚至会去读Slack消息来判断是不是staging环境本身出了问题。
Routines:让Agent自动修Bug的杀手级应用
团队认为Routines(例行任务)是目前最令人兴奋的AI编程用例之一。
一位工程师负责所有产品的语音模式功能,他设置了一个Routine来监听每一个相关的GitHub issue和bug报告。他的Claude会自动接收这些问题,主动提交修复PR,然后通知他审核。
更令人惊讶的是,这位工程师还设置了另一个Routine:自动查找超过5小时未响应的bug报告并提交修复。有一次,一位同事发现自己准备修的bug已经被别人的Claude自动修好了——而那位工程师甚至从未了解过这个功能的细节。
如今团队成员经常收到Claude的提示:"另一个Claude已经修复了这个问题。"这种Agent之间的协作已经成为常态。
此外,Routines还接管了代码审查、CI修复、rebase等日常琐事。团队成员表示:"我已经很久没有手动回复代码审查评论了。"
Auto Mode取代Plan Mode:一次信任的飞跃

在工具使用偏好上,团队透露了一个重要转变:Plan Mode已经被Auto Mode取代。
早期的模型确实需要规划步骤,但随着模型能力的提升,已经不再需要显式的规划阶段。Auto Mode允许用户启动Claude后直接转向下一个任务,无需坐在那里监视。
这背后是一个关于安全性的深刻洞察:当99%的权限请求都会被批准时,人类审核者的注意力会不可避免地涣散。Auto Mode通过将权限判断路由给另一个模型进行安全分类,反而比人工逐条审核更安全——因为它确保你只需要关注真正重要的决策。
为了让Auto Mode达到可信赖的程度,团队做了大量安全工作:
- 收集数千条完整的Agent轨迹和权限提示,进行分类测试
- 邀请红队尝试提示注入和代码库攻击
- 让内部团队持续尝试突破Auto Mode的防线
这不仅是防御现有漏洞,更是防御"能构造出的最智能攻击"。
角色融合:人人都是工程师,人人都是PM

也许最深远的变化发生在组织层面。Claude Code团队观察到一个显著趋势:所有角色都在融合。
- 设计师直接提交PR修改按钮样式,用Claude制作原型比找工程师更高效
- PM直接在应用中做修改
- 财务团队用Claude Code做财务预测
- 数据科学家日常工作离不开Claude Code
团队成员坦言,一开始看到设计师提交PR时感到"恐惧",但代码质量确实不错。这种变化的本质是:当AI负责写代码时,真正重要的是你的想法、产品直觉和业务理解。了解平台、思考产品和用户的人,往往能产出更好的结果。
关于"未来是产品还是工程"的问题,团队的回答很明确:每个人都将同时是两者。工程师端到端地交付产品——从构思、开发到与法务和市场协作;产品、设计、开发者关系团队则都在写代码。
手机编程与远程控制:AI时代的新工作形态

团队成员分享了一个令人意外的数据:大约一半的工程工作现在是在手机上完成的。
通过Remote Control功能,工程师可以在电脑上启动任务,然后用手机远程监控和管理Agent。一位团队成员的习惯是:把电脑留在办公桌上,锁屏插电,然后在沙发上通过手机编程。他会边走边查看Agent状态,边喝咖啡边启动新Agent,甚至在与人交谈时用语音模式即时启动一个Agent来构建新想法。
桌面应用的work tree克隆功能也大大简化了多Agent并行工作的管理——不再需要手动维护六个终端标签和六个Git checkout。
上下文工程的极简主义:少即是多
关于大型企业最关心的上下文工程问题,团队给出了一个可能出乎意料的答案:在当前模型能力下,你不需要做复杂的上下文工程。
回顾演进路径:早期模型需要精心的提示工程,后来需要上下文工程,而今天的模型只需要最小化的系统提示和工具定义,然后让模型自己去获取所需的上下文。
团队的哲学是"上下文极简主义"——只告诉模型它需要知道的,让它自己去探索其余部分。给模型太多上下文就像在微管理它,而模型往往知道更好的路径来达成目标。
从大型机到AI:历史给我们的启示
团队引用了一个90年代的哈佛商业评论案例来类比当前的AI转型:当年企业引入个人电脑时,也经历了"为什么看不到生产力提升"的困惑。答案是——你不能把电脑放在角落里当辅助工具,你必须把纸质文件柜扔掉,把电脑放在一切业务流程的中心。
在Anthropic内部,新员工入职时不问人问题,而是问Claude。代码编写、代码审查、安全审查、填表——一切都通过Claude完成。团队认为,那些真正"想明白了"的企业,都在把AI放到业务流程的核心位置。
当年计算机的这个转型花了10-15年,但AI的转型会快得多——因为我们的工作已经数字化,而AI能使用电脑、能写代码、能运行代码。
展望未来:唯一确定的是变化本身
团队对未来一年的预判充满了不确定性,但有几个明确的趋势:Agent运行时间更长、自主性更强、并行数量从个位数到数百甚至数千。这意味着交互形态将发生根本性变化——如果一年后还在用同样的方式工作,那才是真正令人惊讶的事。
正如团队成员所说:"作为工程师,我从未如此享受工程工作。枯燥的部分不用做了,我只需要想出好点子,和客户交流,然后Claude把一切都构建出来。我甚至不再有待办清单了。"
相关推荐

一句话提示词生成10款网页游戏:Claude Code实战体验
资深开发者用Claude Code命令行工具,仅凭一句话自然语言提示词,在一小时内生成2048、五子棋、俄罗斯方块等10款可玩网页游戏并部署上线。深度解析AI编程的真实能力与局限。

测试人必备的Cursor Skills五大技能包详解
详解测试工程师必备的五大Cursor Skills技能包,覆盖PRD需求分析、用例生成、JMeter脚本自动化、压测报告一键输出、Web自动化测试全流程,助你从执行者升级为质量架构师。

DiffusionGemma:谷歌开源扩散式语言模型,推理速度提升4倍
谷歌发布开源扩散式语言模型DiffusionGemma,将扩散模型思路引入文本生成,实现最高4倍速度提升与实时自我纠错能力。本文详解其核心技术原理、与传统自回归模型的差异及行业影响。