Codex CLI 0.128.0 新增 /goal 命令:AI编码代理学会了「不达目的不罢休」

Codex CLI 0.128.0 新增 /goal 命令:AI编码代理学会了「不达目的不罢休」
当AI学会了「不达目的誓不罢休」,程序员的钱包瑟瑟发抖。
OpenAI 的 Codex CLI 编码代理刚刚发布了 0.128.0 版本,带来了一个让人眼前一亮的新功能——/goal 命令。简单来说,Codex CLI 从此告别了「你说一步我走一步」的乖巧模式,进化成了一个能自己盯着目标死磕到底的自主代理。这个更新虽然看起来不大,但背后的设计思路值得每个关注 AI 编码工具的开发者好好琢磨。
/goal 命令到底干了什么?
以前用 Codex CLI,体验大概是这样的:你给它一个任务,它干完一步就停下来,礼貌地等你下一步指令——像个规规矩矩的实习生。
现在有了 /goal,画风完全变了。你设定一个高层次的目标描述,比如「把这个模块的测试覆盖率提到 90%」或者「修复所有 TypeScript 类型错误」,Codex 就会进入持续循环模式:干完一轮,自己评估目标有没有达成,没达成就接着干,直到两种情况之一发生——目标完成了,或者你配置的 token 预算烧完了。
这个概念其实不是 OpenAI 原创的。社区里一个叫 ghuntley(Geoffrey Huntley)的开发者之前提出过一个叫 Ralph loop 的概念,核心思想就是让 AI 代理像一个不知疲倦的工人一样持续工作,完成一轮后自动评估差距,然后继续循环。Codex CLI 的 /goal 基本上就是把这个社区 idea 官方化了。
好的开源社区就像一个永不停歇的产品经理团队,只不过他们不要工资,只要你把他们的 idea 变成 feature。
两个 Markdown 文件撑起的「自主循环」
最让人觉得有意思的是,这整个看起来很高级的「自主循环」机制,核心实现竟然就靠两个 markdown 文件:
- continuation.md:负责在每轮对话结束时注入提示,对模型进行灵魂拷问——「目标完成了吗?没完成继续干。」它引导模型评估当前状态与目标之间的差距,然后决定下一步该做什么。
- budget_limit.md:负责在 token 消耗接近或达到预算上限时踩刹车,通知模型「钱快烧完了,停下来汇报进度吧。」
说白了,这就是用 prompt engineering 的方式实现了一个 while(!done && wallet.balance > 0) 的循环。优雅得让人想鼓掌,朴素得让人想笑。
这也是当前 AI 代理开发中一个很有代表性的设计哲学——「提示词即程序」。不需要写复杂的控制流代码,几段精心设计的 prompt 模板就能驱动一个自主循环行为。这就是所谓的 agentic engineering(智能体工程) 的实践:通过设计代理的决策循环、工具调用机制和目标评估逻辑,让 AI 具备自主规划和迭代的能力。
Token 预算:贫穷是防止 AI 失控的最后防线
不过,让 AI 自己循环执行任务,有一个绕不开的现实问题——钱。
Token 是大语言模型处理文本的基本单位,每次 API 调用都在消耗 token,而 token 是要花钱的。如果你设了一个「重构整个项目」的 goal,又没有任何预算限制,第二天醒来发现 OpenAI 账单比房贷还高——这画面太美不敢看。
所以 token budget(令牌预算) 这个设计才是 /goal 功能真正的安全绳。你可以给每次任务设定一个 token 消耗上限,代理在累计消耗达到上限时会自动停止执行并汇报当前进度。这不仅是技术上的防护措施,更是 agentic engineering 中成本控制的核心挑战之一。
毕竟,一个没有预算限制的自主循环代理,和一张没有额度上限的信用卡一样危险。
编码代理的进化方向
从更大的视角来看,Codex CLI 的 /goal 功能代表了编码代理(coding agents)的一个重要进化方向。
早期的 AI 编码工具,比如最初版本的 GitHub Copilot,本质上是代码补全——你写半行,它帮你补完。后来进化到能理解上下文、能跨文件操作。而现在,以 Codex CLI、Anthropic Claude Code、Cursor、Devin 为代表的新一代编码代理,已经能够理解高层次的任务描述,自主规划实现步骤,在文件系统中导航,执行命令行操作,并根据执行结果进行迭代修正。
/goal 的出现,把这个进化又往前推了一步:从「能自主执行单步任务」到「能自主循环执行多步任务直到目标达成」。这中间的差距,就像从「能跑一百米」到「能跑马拉松」的区别。
当然,目前这个功能还处于比较早期的阶段,实际使用中目标设定的粒度、评估的准确性、以及复杂项目中的可靠性,都还有待社区的大规模验证。但方向是清晰的——AI 编码代理正在从「工具」变成「同事」。
AI 从「你说一步我走一步」进化到了「你指个方向我自己跑」,唯一的安全绳就是你的 token 余额——这大概是人类历史上第一次,贫穷成了防止 AI 失控的最后防线。
相关推荐
科技前沿GitHub Agent HQ发布:AI编程工具进入平台化竞争时代
GitHub Universe大会发布Agent HQ平台,统一管理编码Agent,Copilot升级支持多模型集成。同期OpenAI完成重组,Anthropic新模型测试,NVIDIA开源系列AI模型,AI编程工具格局加速整合。
科技前沿Gemini 3.5 Flash在GDPval基准上实现巨大飞跃
Google Gemini 3.5 Flash在GDPval基准测试中超越Gemini 3.1 Pro,轻量级Flash模型借助后训练技术逼近前沿水平,重新定义性能与成本的平衡点,为AI应用开发者带来重大利好。
科技前沿Google Gemini Antigravity周配额三倍提升,AI编程不再受限
Google Gemini团队再次将Antigravity周配额提升至三倍,继日配额提升后再次加码。本文解析此次配额调整对开发者的实际影响,以及在AI编程助手竞争格局中的战略意义。