Claude Code Workflow实测:68个子智能体并发工作

Claude Code隐藏的「超级编程」模式
Claude Code(Anthropic推出的命令行编程工具)中隐藏着一个强大但鲜为人知的功能——Workflow工作流模式。这个模式能让AI自动拆解复杂任务,派发数十个子智能体并发执行,实现真正意义上的「AI流水线作业」。近日,有B站UP主在实际项目中深度体验了这一功能,单次任务竟调度了68个子智能体,效率令人惊叹。
与市面上常见的IDE插件式AI助手(如GitHub Copilot、Cursor等主要在编辑器内提供代码补全和对话功能)不同,Claude Code是一款运行在终端中的命令行原生工具。它可以直接访问文件系统、执行Shell命令、操作Git仓库,拥有对整个项目工程的深度感知能力。这种设计使它天然适合承担更复杂的工程级任务编排,而不仅仅是单文件级别的代码辅助。Workflow模式正是在这一架构优势上构建的高级功能。
如何开启Workflow模式
开启这个功能的步骤并不复杂,但需要手动调整设置:
- 在Claude Code中输入
/effort命令 - 默认的思考模式通常是
hi(高思考模式) - 将其切换到最高档位
also coder(超级编程模式)

开启后,Claude Code会根据你提交任务的复杂度,自动决定是否派发子智能体。这里的「子智能体」(Sub-agent)是多智能体系统(Multi-Agent System)中的核心概念——每个子智能体都是一个独立的AI推理实例,拥有自己的上下文窗口和执行环境,能够自主完成被分配的子任务并将结果返回给主智能体。与简单的函数调用不同,子智能体具备一定程度的自主决策能力,可以根据任务需要自行规划执行步骤、调用工具、甚至进行多轮推理。这种架构使得复杂任务可以被真正地「分而治之」。
它本质上是一个自组织的编程工作流——AI会自己构建一个完整的任务编排方案(类似Harness),无需用户手动拆分任务。这里提到的Harness是DevOps领域知名的持续集成/持续部署(CI/CD)编排平台,它的核心能力是将软件交付流程拆解为多个阶段(Stage)和步骤(Step),定义它们之间的依赖关系和并行策略,然后自动化执行整个流水线。Claude Code的Workflow模式借鉴了类似的理念:AI扮演「编排引擎」的角色,自动分析任务依赖关系,决定哪些子任务可以并行执行、哪些需要串行等待,最终形成一个动态的任务DAG(有向无环图)。区别在于,传统CI/CD工具需要人工编写Pipeline配置文件,而Claude Code的工作流完全由AI自主生成。
实战场景:数字人写作技能的批量测试
任务背景
UP主当前正在开发一个数字人项目,其中包含一个写作技能模块(Writing Skill)。这个模块内置了大量不同场景的提示词,需要逐一测试每个提示词的写作效果。

任务分工:写审分离机制
具体的任务设计非常巧妙,采用了**「写审分离」**的原则:
- 主智能体:负责整体监督和任务调度,同时承担最终验收工作
- 子智能体:被派发去执行具体的写作任务,使用不同的提示词生成内容
- 验收环节:由主智能体统一审核,确保「写的人不审,审的人不写」

这种设计思路借鉴了软件工程中的代码审查(Code Review)理念——生产者和审核者必须分离,才能保证质量。在软件工程实践中,这一原则有着深厚的理论基础:心理学研究表明,内容创作者对自己产出的作品存在天然的「确认偏误」(Confirmation Bias),倾向于忽略自身作品中的缺陷。因此,从早期的「同行评审」(Peer Review)到现代开源社区普遍采用的Pull Request审查机制,「生产与审核职责分离」已成为软件质量保证的基石原则之一。Google内部的工程实践甚至要求每一行代码都必须经过至少一位非作者的工程师审核后才能合入主分支。Claude Code将这一人类工程智慧迁移到了AI多智能体协作中,让不同的AI实例分别承担「生产者」和「审核者」的角色,从而在AI系统内部构建了一套自洽的质量控制闭环。
Claude Code的Workflow模式天然支持这种多角色协作。
68个子智能体的调度实况
整个测试过程共进行了四轮,累计调度了68个子智能体。通过输入 /workflow 命令,可以清晰地看到当前的工作流编排状态。

从截图中可以看到具体的并发情况:
- 第一轮:并发启动了 9个子智能体
- 第二轮:再次并发启动 9个子智能体,加上前面的共计约10个在运行
- 后续轮次:持续高并发调度,四轮累计68个
这意味着Claude Code并非串行地逐个执行任务,而是能够同时并发多个子智能体,大幅缩短了整体执行时间。四轮提示词测试「基本上很快都测完了」。
Workflow模式的优势与代价
核心优势
- 自动任务拆解:无需手动规划,AI根据任务复杂度自主决定工作流结构
- 高并发执行:单轮最多可并发9个子智能体,效率远超手动逐一测试
- 内置质量控制:支持写审分离等协作模式,主智能体负责验收把关
- 可视化监控:通过
/workflow命令可以实时查看任务编排和执行状态
不可忽视的Token消耗代价
这个功能最大的缺点就是——极其消耗Token。
68个子智能体意味着68次独立的AI调用,每个子智能体都需要接收上下文、执行任务、返回结果。再加上主智能体的调度和验收开销,整体Token消耗量是普通对话的数十倍。对于按Token计费的用户来说,这是一笔不小的开支。
要理解这一代价的技术根源,需要了解大语言模型的Token计费机制。Token是模型处理文本的基本单位,中文大约每1-2个字对应一个Token,英文则大约每个单词对应1-1.5个Token。每次AI调用的费用由「输入Token数」和「输出Token数」共同决定,其中输入Token包含了系统提示词、上下文信息和用户指令。在多智能体场景下,Token消耗呈倍数级增长的原因有三:第一,每个子智能体都需要独立接收任务上下文(包括项目背景、代码结构、具体指令等),这些上下文信息会被重复传输;第二,主智能体在调度过程中需要维护全局状态,随着子任务增多,其上下文窗口会持续膨胀;第三,验收环节需要主智能体逐一审阅所有子智能体的输出结果,这又产生了大量的输入Token开销。以Claude 3.5 Sonnet的API定价为参考(输入约$3/百万Token,输出约$15/百万Token),68个子智能体的调度成本可能达到单次普通对话的50-100倍。不过,Claude Code的Max订阅计划($100/月或$200/月)提供了一定额度的包月使用量,一定程度上缓解了这一成本压力。
适用场景与使用建议
基于这次实测,Claude Code Workflow模式特别适合以下场景:
- 批量测试:如本例中的提示词批量验证
- 大规模代码重构:需要同时修改多个文件的场景
- 多模块并行开发:各模块相对独立,可以并发处理
- 自动化QA:需要写审分离的质量保证流程
使用建议:
- 任务足够复杂时再开启超级编程模式,简单任务用默认模式即可
- 提前评估Token预算,避免意外超支
- 善用
/workflow命令监控执行进度 - 在任务描述中明确分工要求(如写审分离),帮助AI更好地编排工作流
总结
Claude Code的Workflow功能展示了AI编程工具的一个重要发展方向:从单一对话式编程,走向多智能体协作式编程。这一趋势并非Claude Code独有——整个AI编程工具行业都在向多智能体架构演进。OpenAI的Codex CLI已经开始支持多步骤任务编排;Google的Jules(基于Gemini的AI编程代理)同样采用了任务分解与并行执行的设计理念;开源社区中,AutoGen、CrewAI等多智能体框架也在快速成熟,为开发者提供了自建多Agent编程系统的基础设施。这场「从单兵作战到团队协作」的范式转变,本质上反映了AI能力从「工具级」向「系统级」的跃迁——AI不再只是回答问题或补全代码的助手,而是开始具备项目管理、任务分配和质量控制等系统性工程能力。
68个子智能体并发工作的场景,已经非常接近一个小型开发团队的协作模式。虽然Token消耗是当前的主要瓶颈,但随着模型推理成本的持续下降(过去两年间,主流大模型的API价格已下降超过90%,且这一趋势仍在加速),这种「AI团队作战」的模式很可能成为未来AI编程的主流范式。感兴趣的开发者不妨亲自体验一番。
相关推荐

Claude Code Artifacts功能详解:AI编程如何实现团队协作
Anthropic为Claude Code推出Artifacts功能,可将编码过程生成可交互网页并分享给团队。详解PR讲解、项目仪表盘、UX原型等核心能力,分析AI编程从个人提效到团队协作的范式转移。

Aura Ink电子墨水相框评测:让技术隐形的家居艺术品
深度解析Aura Ink电子墨水相框的设计理念与技术优势。电子墨水如何解决传统数码相框反光、像素感、高功耗等痛点,打造接近纸质照片质感的家居艺术品。

Anthropic模型遭美国政府封禁,禁令反而助推品牌热度?
美国政府以国家安全为由下架Anthropic旗下Fable 5和Mythos 5两款AI模型,亚马逊研究人员发现安全护栏漏洞是导火索。然而封禁引发斯特莱桑效应,反而大幅提升了Anthropic品牌知名度,事件折射出AI监管选择性执法争议与行业安全标准缺失问题。