Claude Code /goal 命令详解:双智能体架构实现AI自主完成任务

Claude Code新命令/goal通过双智能体架构实现AI自主持续完成复杂任务
Anthropic为Claude Code推出/goal命令,采用"工人+老板"双智能体架构:工人负责执行任务,老板负责验证目标是否达成,循环运行直到任务完成。使用关键在于设定精确、可验证的终点线条件,并配合自动批准模式和安全上限(如轮数/时间限制)来控制成本。该功能将Claude Code从需要反复确认的工具升级为能自主完成多步骤任务的智能体。
Anthropic 近日为 Claude Code 推出了一个极具颠覆性的新命令——/goal。这个看似简单的斜杠命令,背后却隐藏着双智能体协作的精妙架构,能让 AI 像一个不知疲倦的员工一样持续工作,直到任务彻底完成。本文基于 YouTube 创作者 Tristen O'Brien 的深度解析,带你全面掌握这一自动化利器。
什么是 /goal?它解决了什么痛点?
在 Claude Code 中输入斜杠 / 会弹出一系列内置命令菜单。这些不是简单的提示词,而是具有特定功能的工具。/goal 就是其中最新、也最强大的一个。
它解决的核心痛点非常明确:AI 做到一半就停下来等你确认。
举个典型场景:你有一整年的银行对账单(PDF 格式),需要提取每笔交易、分类(食品、加油、订阅等),最终汇总到电子表格中。过去,Claude 会处理完第一份报表就停下来,等你输入"继续"。这种情况反复发生,你不得不像保姆一样盯着屏幕超过一个小时。
/goal 彻底改变了这一局面。你只需输入 /goal 加上一句精确描述任务完成状态的语句,Claude 就会一轮接一轮地自动运行,直到任务完全完成。

双智能体架构:/goal 高效运作的秘密
/goal 之所以如此强大,关键在于它背后同时运行着两个 AI 智能体,形成了一套精妙的"员工-老板"协作机制。
第一个智能体:工人(Worker)
主模型(使用 Opus 或 Sonnet)充当真正的执行者。它负责构建文件、编写代码、整理数据——所有实际的"脏活累活"都由它完成。
第二个智能体:老板(Boss)
这是真正的魔法所在。第二个智能体扮演"老板"角色,每当工人完成一步操作,老板就会介入审查,并提出一个核心问题:"目标达成了吗?"
- 如果老板判断"没有",它会明确告诉工人为什么还没完成,然后开启下一轮
- 工人继续干活,老板继续检查
- 这个循环持续进行,直到老板最终确认"是的,完成了"
这种架构的精妙之处在于:它将"执行"和"验证"分离成两个独立的智能体,避免了单一模型自我评估时容易出现的盲区。
如果你在 /goal 运行期间不带参数地再次输入 /goal,它会显示一个仪表盘:运行时长、已完成轮数、已消耗的 token 数量,让你随时掌握进度。
关键配置:自动批准模式
要获得"完全放手、回来发现项目已完成"的体验,你需要完成两件事:
- 输入
/goal并设定终点线(这部分很简单) - 开启自动批准(Auto-approve)模式

默认情况下,每次 Claude 想运行命令或编辑文件时,都会请求许可。如果不开启自动批准,即使在 /goal 运行期间,Claude 也会在每次操作时暂停等待你确认。
不过需要注意的是,开启自动批准意味着你授权 AI 自行完成所有操作。好消息是 Claude 内置了安全网:
- 不会在未经询问的情况下运行危险操作
- 仅限于你指定的项目范围内
- 你可以随时设定操作限制
Anthropic 提供了完整的安全与隐私文档,建议在开启自动模式前仔细阅读。这是一个进阶功能,使用前应充分了解 Claude 能访问什么以及数据如何处理。
终点线的艺术:写好目标条件是成败关键
这是整个 /goal 使用中最关键的环节。如果目标条件写得不好,/goal 要么无限运行浪费钱,要么耗尽你所有的 token。Tristen 坦言自己曾因一个任务就耗光了一天的 token 额度。
核心原则:老板只能看到工人汇报的内容
老板无法自行查看你的文件,所以终点线必须是老板仅凭工人汇报就能确认的具体事项。
❌ 错误示范:
- "清理我的文件并使一切井井有条"——老板怎么知道"一切"都整理好了?
- "别犯错误"或"好好干"——太模糊,老板根本无法确认
✅ 正确示范:
"我的收据文件夹里的每个文件都已按日期和供应商名称重命名,分类到对应文件夹中,并且存在一个支出 CSV 文件,每张收据占一行。"

区别一目了然:好的终点线有具体的文件、具体的文件夹、可验证的输出。老板能在对话中查看并明确判断"是的,这确实完成了"。
必加安全上限
在条件末尾,务必添加安全上限,例如:
- "在第 30 轮之后停止"
- "在 45 分钟后停止"
这是你的安全带。如果出错了,Claude 会停止运行,而不是通宵跑下去烧光你所有的积分。
实战案例:为披萨店生成一周社交媒体内容
假设你经营一家披萨店,知道每天都要在社交媒体上发帖,但根本没时间规划、撰写和构思。这正是 /goal 大显身手的场景。
Tristen 演示了一个完整案例:让 Claude 为披萨店构建一整周的社交媒体内容,包括文案、标签和真实图片(通过 API 获取),最终整合成专业 PDF。终点线设定为"如果 20 轮内没完成就停止",老板确保所有 15 条帖子都配有图片后才放行。
最终结果:一整周的内容、15 篇帖子、覆盖三个平台,每篇文案写好、标签齐全、图片到位。除了输入那个提示词,全程无需人工干预。

这类工作正是社交媒体经理每月收取数百美元费用来做的。类似的应用场景还包括:为宠物美容店建立会员计划、为咖啡店规划一个月的每日特惠、为客户评论撰写个性化回复、批量生成发票等。
成本控制:三条黄金规则
使用 /goal 需要 Claude Code 的专业版或 Max 版计划。如果不注意,它可能会非常烧钱。以下三条规则帮你避免踩坑:
- 始终设置安全网:设定交互次数上限或时间上限
- 运行前检查用量:随时输入
/usage查看积分情况 - 从小处着手:不要一上来就"重组整个业务",先从一个文件夹、一批收据开始,熟悉后再逐步扩大规模
做到这三点,你就能安全、高效地驾驭 /goal 这个强大工具。
总结
/goal 的本质是将 Claude Code 从一个需要不断"喂指令"的工具,升级为一个能自主完成复杂多步骤任务的智能体。双智能体架构(工人+老板)确保了执行质量,而精确的终点线设定则是让整个系统高效运转的关键。对于任何需要处理重复性、多步骤工作的用户来说,这都是一个值得深入学习和使用的功能。
相关推荐
教程攻略Cursor+Codex双IDE协同:开源项目二开实战方法论
基于实战经验总结的开源项目二次开发完整方法论,详解Cursor+Codex双IDE协同工作流,涵盖二开七环节、MVP验证、AI读源码技巧,帮助开发者三天跑通项目、两周完成业务集成。
教程攻略Cursor多Agent实战:50分钟搭建Next.js全栈博客
使用Cursor IDE多Agent协作模式,50分钟内从零搭建全栈博客。涵盖Next.js、Clerk认证、Supabase数据库集成,详解4个AI Agent分阶段开发流程与关键避坑经验。
教程攻略从零搭建AI软件工厂:Cursor工程师的多Agent协作实战经验
Cursor工程师Eric分享AI软件工厂构建实战:从自动化六层级、护栏设计、并行Agent管理到规模化扩展,详解如何用多Agent协作实现7×24小时高效软件开发。