Codex CLI 0.128.0发布：/goal命令实现自动循环直到目标完成

概述

OpenAI 的 Codex CLI 编码代理工具发布了 0.128.0 版本，引入了一个重要的新功能：/goal 命令。这一功能允许用户设定一个目标，Codex 将持续循环执行任务，直到评估目标已完成，或者配置的 token 预算耗尽为止。

Codex CLI 是 OpenAI 于 2025 年开源的终端原生编码代理工具，它直接运行在开发者的命令行环境中，能够读取本地代码库、执行 shell 命令、编辑文件并运行测试。与基于浏览器的 AI 编码助手（如 GitHub Copilot Chat 或 Cursor）不同，Codex CLI 采用了轻量级的终端交互范式，更贴近资深开发者的工作流。它默认使用 OpenAI 的 o4-mini 模型，同时支持通过配置切换到其他模型。作为一个完全开源的项目（基于 Apache 2.0 协议），Codex CLI 也成为了社区探索编码代理模式的重要试验场。

这本质上是 OpenAI 对 Ralph Loop 模式的官方实现，标志着编码代理从单轮交互向持续自主执行的重要演进。

/goal 命令的工作原理

核心机制

/goal 命令的设计理念很直接：用户定义一个明确的目标，Codex 代理会自动进入循环模式，在每一轮执行结束后自我评估是否已经达成目标。如果目标尚未完成，代理会继续下一轮操作，直到满足以下两个退出条件之一：

目标完成：代理判断用户设定的目标已经实现
预算耗尽：配置的 token 预算已经用完

这种「执行—评估—决策」的循环结构，在计算机科学中被称为控制循环（Control Loop），广泛应用于机器人控制、自动化运维等领域。将这一模式引入 LLM 代理，意味着 AI 编码工具开始具备类似自动化系统的持续执行能力，而不再局限于一次性的请求-响应交互。

基于提示工程的实现方式

从代码层面来看，这个功能主要通过两个提示模板实现：

goals/continuation.md：在每一轮结束时自动注入，引导代理评估当前进度并决定是否继续执行
goals/budget_limit.md：处理 token 预算限制的逻辑，确保代理在资源耗尽时能够优雅地停止

这种基于提示工程的实现方式没有引入复杂的外部控制逻辑，而是利用 LLM 自身的理解能力来管理执行流程，保持了架构的简洁性。

提示工程（Prompt Engineering）是指通过精心设计输入给大语言模型的文本指令，来引导模型产生期望行为的技术。在传统软件中，控制流通常由 if-else 语句和状态机等硬编码逻辑实现；而在 LLM 代理系统中，提示模板充当了「软件逻辑」的角色——通过自然语言描述来定义代理的行为规则。这种方式的优势在于灵活性极高，开发者可以通过修改 Markdown 文件来调整代理行为，而无需改动底层代码。但其劣势也很明显：行为的可预测性依赖于模型的理解能力，不同模型版本可能产生不同的执行结果。Codex CLI 选择这种实现路径，体现了当前 AI 工程中「以提示为代码」（Prompt as Code）的设计趋势。

为什么 /goal 功能对开发者很重要

从单轮到多轮的范式转变

传统的 AI 编码助手通常是单轮交互模式：用户提问，AI 回答，然后等待下一个指令。/goal 功能打破了这个模式，让代理能够自主规划和执行多步骤任务。

这对于复杂的编程任务尤其有价值。例如，重构一个大型模块、实现一个完整的功能特性，或者修复一系列相关的 bug——这些任务往往需要多个步骤，每个步骤之间有逻辑依赖关系。

Ralph Loop 模式的官方化

Ralph Loop 是社区中已经流行的一种模式，即让 AI 代理在循环中持续工作直到任务完成。这一模式由澳大利亚开发者 Geoffrey Huntley 提出并推广，其命名来源于一种直白的理念：像一个不知疲倦的工人（Ralph）一样持续循环工作。具体实现方式通常是在代理的系统提示中注入类似「如果任务未完成，请继续执行下一步」的指令，配合外部脚本在代理输出后自动重新触发新一轮对话。在 Codex CLI 正式支持之前，开发者们已经通过 shell 脚本包装、自定义提示注入等方式在 Claude Code、Aider 等工具中实现了类似的循环执行模式。这种「民间智慧」被官方工具采纳，是 AI 工具生态中社区与厂商良性互动的典型案例。

OpenAI 将这种模式正式集成到 Codex CLI 中，反映了几个行业趋势：

Agentic AI 工程的成熟：自主代理模式正在从实验性概念走向生产级工具
社区驱动的创新：官方工具在积极吸收社区最佳实践
token 预算管理的重要性：随着代理自主性增强，资源控制变得更加关键

安全与控制：token 预算限制机制

/goal 功能内置了 token 预算限制机制，这是一个关键的安全设计。在代理自主循环执行的场景下，如果没有适当的停止条件，可能会导致不必要的资源消耗或意外行为。

要理解这一机制的重要性，需要先了解 token 的概念。在大语言模型中，token 是文本处理的基本单位，大致相当于一个英文单词的 3/4 或一个中文字符。每次 LLM 处理输入和生成输出都会消耗 token，而 OpenAI 等服务商按 token 用量计费（例如 GPT-4o 的输入价格约为每百万 token 2.5 美元）。在自主循环场景下，代理每一轮执行都会累积 token 消耗——包括重新读取上下文、生成代码、执行评估等环节。如果一个复杂任务需要数十轮循环，token 消耗可能迅速攀升至数万甚至数十万。没有预算限制的代理就像一张没有额度上限的信用卡，可能在开发者不注意时产生远超预期的费用。因此，token 预算不仅是技术安全机制，更是经济安全机制。

预算限制确保了即使代理对目标完成的判断出现偏差，系统也能在可控范围内停止。这体现了在赋予 AI 更多自主权的同时保持人类控制的设计哲学——对于企业级使用场景来说，这种可预测的成本控制尤为重要。

Agentic AI 的行业背景

Codex CLI 的 /goal 功能是当前 Agentic AI（代理式人工智能）浪潮中的一个缩影。Agentic AI 指的是能够自主感知环境、制定计划、执行行动并根据反馈调整策略的 AI 系统，与传统的「被动响应式」AI 助手有本质区别。2025 年以来，这一方向已成为 AI 行业最活跃的竞争前沿：Anthropic 的 Claude Code 支持自主执行复杂编码任务，Google 的 Jules 和 Project Mariner 探索浏览器和代码环境中的代理能力，微软则通过 GitHub Copilot Agent Mode 将代理模式集成到 VS Code 中。在开源社区，Aider、SWE-agent、OpenHands 等项目也在快速迭代。这些工具的共同趋势是：AI 正在从「建议者」转变为「执行者」，从回答「怎么做」转向直接「去做」。然而，这种转变也带来了新的挑战——如何确保代理行为的可控性、如何处理代理犯错后的回滚、如何在自主性与安全性之间取得平衡——这些问题正在定义下一代 AI 工程的核心议题。

总结

Codex CLI 0.128.0 的 /goal 功能是编码代理工具发展中的一个重要节点。它通过简洁的提示工程实现了自主循环逻辑，让开发者能够将更大粒度的任务委托给 AI 代理，同时通过 token 预算机制保持了必要的控制。随着这类功能的普及，AI 辅助编程正在从「问答模式」向「目标驱动的自主执行模式」转变。

核心要点

Codex CLI 0.128.0 新增 /goal 命令，允许代理持续循环执行直到目标完成或 token 预算耗尽
该功能是社区流行的 Ralph Loop 模式的官方实现，标志着编码代理从单轮交互向自主执行的演进
功能主要通过 continuation.md 和 budget_limit.md 两个提示模板实现，利用 LLM 自身能力管理执行流程
内置 token 预算限制作为安全机制，防止代理无限循环消耗资源
体现了 Agentic AI 工程从实验性概念走向生产级工具的行业趋势