Claude Code创造者分享3个实战技巧:把AI当团队用

Claude Code创造者分享三大技巧:并行多任务、循环执行、自验证闭环
Claude Code创造者Boris Cherny分享了三个核心使用技巧:一是并行开启多个Agent同时处理不同任务,把AI当团队而非单个助手;二是利用Loop机制让AI定时循环执行任务,实现持续自动化运转;三是构建反馈闭环,让AI自己运行测试、发现错误并修正,直到满足验收标准。这三个技巧代表了从被动代码生成到主动智能体编程的范式转变。
Claude Code 的创造者 Boris Cherny 最近在一场访谈中,分享了他日常使用 Claude Code 的真实工作流。作为这款工具的缔造者,他的用法远超大多数人的想象——在他手里,Claude Code 不再是一个简单的编程助手,而是一整支 AI 开发团队。
Claude Code 是 Anthropic 公司推出的命令行 AI 编程工具,与嵌入 IDE 的代码补全插件不同,它直接在终端中运行,能够理解整个代码仓库的上下文,操作文件系统、执行 shell 命令并与 Git 交互。Boris Cherny 此前以《Programming TypeScript》一书闻名于开发者社区,在类型系统和编程语言设计方面有深厚积累。他加入 Anthropic 后主导了 Claude Code 的产品设计,其核心理念是让 AI 成为一个能直接参与完整开发流程的智能体,而不仅仅是一个问答式的代码生成器。
本文拆解他分享的三个最值得普通开发者学习的 Claude Code 技巧,每一个都能显著提升你的 AI 编程效率。
技巧一:并行多任务,不要只开一个窗口
大多数人使用 Claude Code 的方式是:打开一个对话窗口,提一个需求,等它写完,再提下一个。这种串行工作方式严重浪费了 AI 的并发能力。
Boris Cherny 的做法完全不同。他透露自己现在很多工作直接在手机上完成——打开 Claude App,左侧的 Code 标签页里同时运行着多个会话,通常至少有 5 到 10 个,每个会话里又有一堆 Agent 在并行干活。

这里提到的 Agent(智能体)是当前 AI 领域的核心概念之一。与传统的聊天式 AI 不同,Agent 具备自主规划、工具调用和环境交互的能力——它不只是回答问题,而是能够拆解任务、调用终端命令、读写文件、执行代码并根据结果调整下一步行动。从技术实现上看,Agent 与普通聊天机器人的核心区别在于三点:第一,Agent 拥有工具调用(Tool Use / Function Calling)能力,可以执行代码、访问 API、操作文件系统;第二,Agent 具备规划能力,能将复杂任务自主分解为多个子步骤并按序执行;第三,Agent 拥有记忆和状态管理机制,能在多轮交互中保持上下文连贯。当前主流的 Agent 框架(如 LangChain、AutoGPT、CrewAI)大多基于 ReAct(Reasoning + Acting)范式,让模型在推理和行动之间交替进行,形成「思考→行动→观察→再思考」的循环。
多 Agent 并发的思路源自分布式系统和微服务架构的理念:将一个复杂系统拆分为多个独立运行的单元,每个单元专注于单一职责,彼此之间通过共享代码仓库或消息机制协调。这种模式在软件工程中已被证明能显著提升吞吐量和容错能力,如今被迁移到 AI 编程场景中,本质上是把「人管理微服务」变成了「人管理 AI 智能体集群」。
更夸张的是,他在采访中提到:白天可能有几百个 Agent 在跑,晚上会有几千个 Agent 做更深层的工作。 这些 Agent 各司其职——有的负责修 bug,有的负责写测试,有的负责改前端 UI,还有的负责查看和整理用户反馈。
普通开发者如何借鉴?
你不需要跑几千个 Agent,但可以从「同时开 2-3 个任务」开始。比如一个窗口让 AI 写业务逻辑,另一个窗口让它写对应的单元测试,第三个窗口让它优化已有代码的性能。关键思维转变是:把 AI 当团队用,而不是当单个助手用。
技巧二:用 Loop 让 AI 循环执行任务
Boris 特别推荐的第二个 Claude Code 技巧是 Loop——让 Claude Code 定时、循环地执行任务。你可以把它理解为给 AI 设置一个「定时闹钟」,每隔一段时间自动跑一次指定的工作。

这一机制的本质,是将持续集成/持续部署(CI/CD)的理念从传统 DevOps 领域引入到 AI 编程工作流中。传统的 CI/CD 流水线(如 Jenkins、GitHub Actions)通过监听代码提交事件来自动触发构建、测试和部署。而 Claude Code 的 Loop 则更进一步——它不仅能响应事件,还能以固定时间间隔主动巡检,并且具备 AI 的理解和决策能力,可以自主判断问题的性质并采取修复行动。
要理解 Loop 的突破性,需要将它与传统自动化工具做对比。Linux 系统中的 cron 定时任务和 Windows 的 Task Scheduler 只能执行预定义的脚本——如果脚本没有覆盖到某种异常情况,任务就会失败。CI/CD 工具虽然更智能,支持条件分支和错误重试,但本质上仍是基于规则的流水线,无法理解错误的语义。Claude Code 的 Loop 融合了定时触发和 AI 推理能力,使得每次循环执行时,AI 都能根据当前项目的实际状态做出不同的判断和操作——比如它能区分「这是一个语法错误,可以自动修复」和「这是一个架构设计问题,需要通知开发者」,这是传统自动化工具根本无法实现的。对于熟悉 Kubernetes 健康检查探针(Liveness Probe / Readiness Probe)的开发者来说,Loop 的概念并不陌生,但 AI 赋予了它质的飞跃。
他自己举了几个非常实用的例子:
- 自动修 bug:一个 Loop 持续盯着代码任务,哪里报错了就自动去修复
- 自动同步:项目有更新时,自动同步到相关的依赖和模块
- 健康检查:持续检查整个项目的运行状态,确保服务不会宕机
- 用户反馈收集:每 30 分钟抓一次 Twitter 上的用户反馈,自动分类整理

这对 AI 编程工作流意味着什么?
有了这种定时任务机制,AI 就不再是「你问一句它答一句」的被动工具,而变成了一个持续运转的自动化系统。它可以在你睡觉的时候帮你优化代码、在你开会的时候帮你收集信息、在你专注核心功能的时候帮你处理琐碎的维护工作。
对于个人开发者来说,哪怕只是设置一个「每隔 5 分钟检查一次构建是否通过」的简单 Loop,都能省去大量手动排查的时间。
技巧三:让 AI 自己验证结果,构建反馈闭环
Boris 在采访中反复强调的一个核心思路是:AI 不能只是写完代码就算完,它还必须跑测试、发现错误、持续修正。 你需要给 AI 构建一个完整的反馈闭环。

这一理念与软件工程中经典的测试驱动开发(TDD)方法论高度契合。TDD 由 Kent Beck 在 2003 年通过《Test-Driven Development: By Example》一书系统化提出,其核心哲学是「测试即规格说明」。TDD 的标准流程是:先写一个失败的测试用例定义期望行为(红),再编写最少量的代码使测试通过(绿),最后重构优化代码结构——即经典的「红-绿-重构」循环。
将这一理念应用到 AI 编程中,意味着你不是让 AI 凭空写代码,而是先给它一套明确的验收标准(相当于测试用例),然后让 AI 在「编写-测试-修复」的循环中自主迭代。这种方式之所以特别适合 AI 编程,是因为大语言模型的输出具有概率性和不确定性——模型的生成过程受 temperature(温度参数)等超参数影响,同一个 prompt 在不同时刻可能产生质量参差不齐的代码。单次生成的代码很难保证完全正确,尤其是在涉及复杂业务逻辑、边界条件处理和多模块交互的场景下。通过引入自动化测试作为「裁判」,AI 可以获得客观的对错反馈信号,而不是依赖人类逐行审查,从而大幅提升最终交付代码的可靠性。这本质上是将强化学习中「奖励信号驱动行为优化」的思想,以一种轻量级的方式应用到了编程工作流中。
这也恰恰是很多人用 AI 编程效果不理想的根本原因。大部分人的 prompt 是这样的:「帮我写一个登录功能」。但到底什么才算「真正完成了」?页面长什么样?需要处理哪些异常?哪些边界情况不能出错?这些都没有说清楚。
更高效的 Claude Code 工作流
Boris 建议的工作流是:
- 提前定义验收标准:明确告诉 AI 最终结果应该是什么样的。比如「页面必须包含用户名和密码两个输入框,登录失败时显示红色错误提示,密码输入不能少于 8 位」
- 让 AI 自己运行测试:不是你手动去检查,而是让 AI 写完代码后自动执行测试用例
- 发现问题自动修复:测试不通过时,AI 应该自己分析报错信息并修正代码
- 循环迭代直到通过:整个过程形成闭环,直到所有验收标准都满足为止
核心洞察在于:很多时候 AI 不是不会写,而是不知道你真正想要的结果是什么。 当你把验收标准讲清楚、把反馈机制建好,AI 的输出质量会有质的飞跃。
总结:从「用工具」到「带团队」的思维升级
回顾 Boris Cherny 分享的三个 Claude Code 技巧,背后其实是同一个底层逻辑——把 AI 从一个被动的代码生成器,变成一个主动运转的开发团队:
| 技巧 | 核心思想 | 类比 |
|---|---|---|
| 并行多任务 | 同时让多个 Agent 各司其职 | 像管理一个开发团队 |
| Loop 循环执行 | 让 AI 持续自动化运转 | 像设置 CI/CD 流水线 |
| 自验证闭环 | 给 AI 明确标准和反馈机制 | 像写好验收测试用例 |
从更宏观的视角来看,这三个技巧代表的是 AI 编程领域正在发生的一次重大范式转移。AI 编程工具的演进可以清晰地划分为三个阶段:第一阶段是以 GitHub Copilot(2021 年发布,基于 OpenAI Codex 模型)为代表的「智能自动补全」,它在你打字时预测下一行代码,本质上是一个上下文感知的代码片段推荐引擎。第二阶段是以 ChatGPT、Claude 对话为代表的「对话式代码生成」,你描述需求,AI 返回完整的代码片段,但它对项目整体结构缺乏感知,生成的代码往往需要大量人工适配。而 Boris 展示的是第三阶段——Agentic Coding(智能体编程),以 Claude Code、Cursor Agent、Devin 等工具为代表,AI 不再只是生成代码片段,而是作为一个具备完整开发能力的智能体,能够自主浏览项目结构、理解代码上下文、执行终端命令、运行测试、甚至部署服务。这一演进的底层驱动力包括:大语言模型上下文窗口从最初的 4K token 扩展到 200K+ token(使 AI 能够「看到」整个代码仓库)、Function Calling / Tool Use 能力的标准化和成熟、以及推理模型(如 Claude 3.5 Sonnet、Claude 4)在代码理解和生成上的能力突破。
这三个技巧的门槛并不高,但它们代表的是一种全新的 AI 编程协作范式。当你不再把 Claude Code 当作「一个更聪明的代码补全工具」,而是当作「一支可以 7×24 小时工作的 AI 团队」来使用时,你的开发效率将会产生根本性的变化。
从今天开始,试着同时开两个任务窗口,设置一个简单的 Loop,写清楚你的验收标准——你会发现,AI 编程的天花板远比你想象的要高。
相关推荐
观点碰撞Windsurf CEO深度访谈:速度是唯一的护城河
Windsurf CEO Varun Mohan深度访谈,分享AI编程IDE的创业pivot经验、产品构建方法论、异步Agent挑战,以及与Cursor竞争的差异化策略。速度才是创业公司唯一的护城河。
观点碰撞被低估即自由:AI时代的逆向竞争哲学
探讨AI行业中"被低估即自由"的逆向竞争策略。从OpenAI、DeepSeek到Cursor,解析为何低调积蓄力量比站在风口浪尖更具战略优势,以及这一哲学对AI创业者和从业者的深刻启示。
观点碰撞新教工作伦理如何被劫持:从保护工人到压迫工人的演变
哲学家Elizabeth Anderson揭示新教工作伦理如何从保护工人的理想被扭曲为压迫工具。从清教徒的公平商业伦理到新自由主义的复活,深度解析工作伦理的历史演变及其对AI时代劳动关系的启示。