Codex CLI /goal命令详解：自动循环执行直到目标完成

Codex CLI /goal 命令是什么

OpenAI 开源编码代理 Codex CLI 在 0.128.0 版本中引入了 /goal 命令。简单来说，用户通过这个命令设定一个明确目标，Codex CLI 就会进入自动循环模式——持续执行任务、评估进度，直到目标完成或 token 预算耗尽。

Codex CLI 是 OpenAI 于 2025 年开源的一款终端编码代理工具，它运行在开发者的本地终端环境中，能够读取项目代码、执行 shell 命令、编辑文件，本质上是一个具备代码理解和执行能力的 AI 助手。它与 OpenAI 同期推出的 Codex 云端代理产品（通过 ChatGPT 界面使用、在云端沙箱中运行）定位不同——Codex CLI 更面向习惯命令行工作流的开发者，强调本地环境的深度集成和开源可定制性。在当前 AI 编程工具快速演进的格局中，Codex CLI 与 Anthropic 的 Claude Code、Google 的 Gemini CLI 等产品形成了直接竞争关系，而 /goal 命令的引入正是其在自主执行能力上的一次重要升级。

这一设计与社区中广泛讨论的 "Ralph Loop" 模式一脉相承，标志着编码代理正从单轮交互走向持续自主执行。

两个终止条件

/goal 命令的循环并非无限制运行，它有两个明确的终止条件：

目标完成：Codex CLI 在每轮执行后自动评估当前状态，判定目标已达成时停止
预算耗尽：消耗的 token 数量达到预先配置的上限，代理主动停止并汇报进度

这里的 "token" 是大语言模型处理文本的基本单位，一个英文单词通常对应 1-3 个 token，中文字符通常每个字对应 1-2 个 token。OpenAI 等模型提供商按 token 数量计费，包括输入（prompt）和输出（completion）两部分。在传统的单轮交互中，一次对话消耗的 token 量相对可预测；但在 /goal 这样的自主循环模式下，代理可能执行数十甚至上百轮对话，每轮都会累积 token 消耗，如果不加控制，一个复杂任务的 API 调用成本可能迅速攀升到数十美元。因此，token 预算机制在这种场景下不再是可选项，而是必需的安全保障。

这种设计在赋予代理自主性的同时，通过 token 预算机制保留了成本控制的安全阀，避免无限循环造成资源浪费。

Prompt 工程驱动的实现原理

从技术角度看，/goal 的核心并非复杂的程序逻辑，而是通过精心设计的 prompt 模板来驱动。在 Codex CLI 的 GitHub 仓库中，有两个关键模板文件：

goals/continuation.md：每轮执行结束时自动注入，引导模型评估当前进度，决定是否继续下一步操作
goals/budget_limit.md：当 token 预算接近或达到上限时注入，通知模型停止执行并汇报当前状态

这种基于 prompt 注入的实现方式相当巧妙。要理解它的巧妙之处，可以将其与传统的状态机驱动方式做对比。在经典的软件工程中，实现一个能自主循环执行的代理通常需要构建显式的状态机——定义"规划中"、"执行中"、"评估中"、"已完成"等离散状态，编写状态转换逻辑，并为每种状态设计专门的评估函数来判断任务进度。这种方式代码复杂度高，且难以应对编程任务中千变万化的场景。而 prompt 注入方式则将状态评估和决策的职责完全交给大语言模型本身——通过在对话上下文中注入精心设计的指令文本，引导模型利用其自身的语言理解和推理能力来判断"当前做到哪一步了"、"下一步应该做什么"、"目标是否已经达成"。这种方式的代码实现极为轻量，同时具备极强的泛化能力，因为 LLM 天然能够理解各种不同类型的编程目标。

这也再次说明，在 AI 代理开发中，prompt 工程仍然是最核心的技术手段之一。

Ralph Loop 模式：从实验到标准范式

/goal 功能的设计灵感来自 Geoffrey Huntley 提出的 "Ralph Loop" 概念。这一模式的核心思想是：让 AI 代理在持续循环中自主工作，不断评估进度、调整策略，直到任务完成。

Ralph Loop 并非凭空出现，它处于 AI 代理自主执行的技术演进脉络之中。2023 年，AutoGPT 和 BabyAGI 等项目率先探索了让 LLM 自主循环执行任务的可能性——AutoGPT 通过让 GPT-4 自行制定计划、执行操作、评估结果来完成用户设定的目标，BabyAGI 则实现了任务的自动分解和优先级排序。这些早期项目虽然引发了巨大关注，但在实际使用中普遍面临循环失控、任务偏离、成本不可控等问题，更多停留在概念验证阶段。Ralph Loop 的贡献在于将这一思想聚焦到编码场景，并结合 token 预算等实用约束机制，使其更接近生产可用。而 OpenAI 将其集成到 Codex CLI 这样的官方工具中，则标志着自主循环执行模式经过两年多的社区实验，终于获得了主流工具链的认可。

相比传统的单轮问答式交互，Ralph Loop 模式在编码场景中有几个明显优势：

胜任复杂任务：很多编程任务需要多步骤完成，单轮交互往往无法覆盖完整流程
支持自我纠错：在循环过程中，代理可以发现并修复前几轮引入的 bug
减少人工干预：用户只需设定目标，不必在每一步手动引导

OpenAI 将这一模式直接集成到官方工具中，意味着自主循环执行已经从实验性概念走向了生产级应用。

开发者如何用好 /goal 功能

/goal 命令的推出，对日常开发工作流有几点实际影响：

学会管理 token 预算

随着代理自主执行时间变长，合理设置 token 预算上限变得至关重要。设得太低，任务可能中途被打断；设得太高，则会产生不必要的 API 调用成本。建议根据任务复杂度分级设置预算，简单重构类任务给低预算，跨文件功能开发给高预算。

写好目标描述

和写 prompt 一样，目标描述的质量直接决定执行效果。一个清晰、可衡量的目标能显著提升代理的执行效率。比如，"优化性能" 就不如 "将首页加载时间从 3 秒降到 1.5 秒以内" 来得具体有效。好的目标描述通常包含三个要素：明确的完成标准（怎样算做完）、具体的作用范围（改哪些文件或模块）、以及可观测的验证方式（如何确认结果正确）。例如，"为 src/api/ 目录下的所有公开函数添加 JSDoc 注释，确保 npm run lint 无报错" 就是一个代理容易理解和执行的高质量目标。

适应角色转变

这一趋势预示着编码代理正从"辅助工具"向"自主执行者"转变。开发者的工作重心也会更多地转向目标设定、结果审查和代码质量把关。这种转变在整个 AI 编程工具行业中已经形成共识——Anthropic 的 Claude Code 同样支持长时间自主执行模式，Cursor 等 IDE 集成工具也在探索类似的 Agent 模式。可以预见，未来开发者与 AI 的协作将越来越像"技术经理与工程师"的关系：开发者负责定义需求、拆解目标、审查产出，而 AI 代理负责具体的代码实现和迭代。掌握如何有效地向 AI 代理下达目标、评估其产出质量，将成为开发者的一项核心技能。

总结

Codex CLI 0.128.0 的 /goal 命令在实现上看似简单——主要依赖两个 prompt 模板的自动注入——但它代表了编码代理发展的一个重要方向。当 AI 代理能够围绕目标自主循环执行时，开发者与 AI 的协作模式将发生实质性变化：从逐步指令式交互，转向目标驱动的自主完成。对于关注 AI 编程工具的开发者来说，现在是开始熟悉这种新范式的好时机。

核心要点

Codex CLI 0.128.0 新增 /goal 命令，支持设定目标后自动循环执行直到完成或 token 预算耗尽
该功能借鉴了 Ralph Loop 模式，通过 continuation.md 和 budget_limit.md 两个 prompt 模板实现自动注入驱动
实现方式以 prompt 工程为核心，利用 LLM 自身能力进行进度评估和决策，无需复杂外部逻辑
token 预算机制作为安全阀，防止无限循环导致的资源浪费
标志着编码代理从单轮交互向持续自主执行模式的演进趋势