OpenAI Codex 大师课完整解析：从插件系统到Sub Agent，一文吃透AI编程Agent的全部能力

当一个AI不仅能写代码还能帮你回邮件、审PR、做游戏，你开始怀疑自己的工位是不是快要被一个沙箱取代了。这篇文章基于OpenAI伦敦团队带来的 OpenAI Codex 大师课，由 Vaibhav Srivastav 和 Katia Gil Guzman 主讲，把 Codex 从底层架构到前沿实验功能全部拆了个底朝天。如果你在用 Codex 或者正打算上手，这篇值得收藏。

Codex 到底是什么？不只是代码补全工具

OpenAI Codex 是一个完整的软件工程 Agent。注意，不是代码补全，不是聊天机器人——是 Agent。它能写代码、跑命令、执行测试、探索整个代码库，甚至连接 Figma、Linear、Notion 这些第三方工具。

底层架构上，Codex 基于 GPT 5.3 Codex、GPT 5.4 等模型，上面套了一层统一的 Agent Harness，负责管理工具执行、环境设置和安全策略。翻译成人话就是：给 AI 套了个安全笼子，让它干活但别让它把服务器删了。

交互方式也够多样——Codex App、IDE 扩展、CLI、Slack、GitHub，你在哪它就在哪。这哪是个编程助手，这分明是个全栈实习生，而且不要工资、不摸鱼、不在 Slack 上发表情包。

模型演进：版本号更新比换手机壳还快

Codex模型演进与性能数据

Codex 的模型迭代路线相当激进：

GPT 5.2 → GPT 5.2 Codex → GPT 5.3 Codex → GPT 5.3 Codex Spark（与 Cerebras 合作）→ GPT 5.4
同时发布了 GPT 5.4 Mini 和 GPT 5.4 Nano，分别用于短任务和 Sub Agents

性能方面的提升也很实在：

引入 WebSockets 实现约 1.75 倍 token 处理速度提升
Fast Mode 在此基础上再翻一倍

合着以前的速度是故意慢的？

用户数据更能说明问题：Codex 已经突破 300 万周活跃用户，自今年 1 月以来增长超 3 倍。这增长曲线让任何 SaaS 创始人看了都会流泪。不过话说回来，当你的产品能替人写代码，用户增长不快才奇怪。

Codex App：你梦寐以求的完美同事

Codex App 的核心能力包括：

跨项目工作和同一项目内多功能并行开发
原生 Git Work Tree 支持——终于不用在十个分支之间反复横跳了，上下文切换的痛苦只有程序员懂
Automations 自动化任务（类似 cron job）——本质上就是给 AI 装了个闹钟：到点了，干活
原生 Windows 支持，包含原生 Windows 沙箱（号称业界首创）——Windows 用户终于不再是二等公民了

最新发布的功能按时间排序包括：Plugins、Mini Models、Code Review、Security 等。每一个都值得单独拿出来说。

Plugins 插件系统：乐高积木遇上企业级中间件

Codex 的 Plugins 系统把三样东西打包成了可复用的工作流：

组件	作用	举例
Skills	可复用的指令包	自动创建，避免重复操作
Apps	连接第三方服务	Notion、Linear、Google Drive
MCP Servers	外部工具扩展	暴露外部系统能力给 Codex

最妙的是 Skills 可以让 Codex 自动创建——AI 自己给自己写说明书，这是什么级别的自我管理？你既可以用官方提供的插件，也可以创建自定义插件。感觉 Codex 正在悄悄地把自己变成所有 SaaS 产品的超级入口。

Automations 自动化：你一直想雇但雇不起的私人助理

Automations自动化配置界面

Automations 功能是这次大师课里最让人兴奋的部分之一。看看这些实际用例：

Slack 自动分类：每天早上 9 点自动检查 Slack 消息，按紧急程度分类标记
Gmail 自动化：筛选需要回复的邮件，判断时效性和合法性——终于有人替你过滤那些"恭喜你中了五百万"的邮件了
支持对话式创建：直接告诉 Codex 你想要什么自动化，它自己搞定配置
可以设置运行频率、关联项目、连接各种 Apps 和 Plugins

演讲者 Katia 说这功能每天帮她省好几个小时。我信，因为光是处理 Slack 未读消息就够喝一壶的了。

实战演示：2 分钟同步 57 个文件，1 小时从零做出游戏

大师课上有两个演示直接把现场气氛拉满了。

Google Drive 数据同步

用 Google Drive 插件让 Codex 读取代码库中 57 个 YAML 事件文件，然后自动更新到 Google Sheets 表格。整个过程耗时 2 分钟。我手动做这事大概需要 2 小时外加 3 杯咖啡。

平台跳跃游戏开发

这个才是真正炸裂的。使用 Games Studio 插件（包含 Image Gen 和 Playwright Interactive 技能），只需要一句提示词——"做一个砖块平台跳跃游戏"：

Image Gen 自动生成游戏精灵图等视觉素材
Playwright Interactive 作为无头浏览器让 Codex 可视化调试
完整游戏从零构建约 1 小时

这已经不是辅助编程了，这是 AI 在独立创业。独立游戏开发者看到这里，心情大概比较复杂。

Code Review 代码审查：AI 面前人人平等

Codex Code Review审查界面

Codex Code Review 被认为是业界最好的代码审查工具之一，核心能力包括：

在 GitHub 上自动审查每个 PR，按 P0/P1/P2 优先级标注问题
审查不只看 diff，还会分析整个仓库上下文，发现二阶效应影响
支持通过 /review 命令在 CLI 或 App 中触发

一个关键细节：OpenAI 内部 100% 的 PR（包括 Greg 的）默认由 Codex Code Review 审查。这说明什么？说明在 AI 面前人人平等，管你是谁的代码都得过机器这一关。毕竟 AI 不会因为快下班了就草草 approve。

最骚的操作是他们还发布了 Claude Code 插件——让竞争对手的用户也能用自家的审查服务。这商业格局属实大气。

Sub Agents 子代理：一个人干一群人的活

Sub Agents并行任务执行

Sub Agents 系统是 Codex 最强大的能力之一。它可以把主任务分解为可并行的独立子任务，分配给多个 Agent 同时执行。

演示中，20 个 Sub Agent 并行审查 45 个 Agent persona 文件，系统自动启用 Plan Mode 分解为 5 个子任务。

默认提供三种 Sub Agent 人格，简直就是 RPG 游戏里的职业分工：

人格类型	定位	适用场景
Default	通用型	常规任务
Worker	执行导向	明确的实现任务
Explorer	探索导向	调研、分析、方案探索

每个 Sub Agent 还能自定义模型、推理强度、沙箱模式（读写/只读），可以配置 MCP 访问（如 Sentry、Linear）和 Skills。配置自由度比组装电脑还高。

更厉害的是，你可以让 Codex 分析历史会话自动推荐创建 Sub Agent。AI 开始学会自我复制了，这剧情走向有点赛博朋克。

实际应用场景包括：网络安全漏洞分析、功能方案头脑风暴、测试运行等。

前沿实验功能：Garden Approvals 与 Hooks

前沿实验功能演示

Garden Approvals：用 AI 监督 AI

YOLO 模式的名字起得很诚实——确实是"你只活一次"，因为给 AI 全权限搞不好服务器也只活一次。

Garden Approvals 的解决方案很优雅：当 Codex 需要执行特权操作（删目录、启服务器、暴露文件）时，自动启动一个 Sub Agent 来验证操作的安全性。大多数情况下无需人工干预，有效减少人工审批疲劳。

本质上就是 AI 界的"谁来监督监督者"问题，答案是：再来一个监督者。套娃式安全架构，但确实管用。

Hooks 钩子系统

支持三种 Hooks，通过 hooks.json 配置文件和 Python 脚本实现：

Start Hook：会话开始时自动从 GitHub 拉取最新代码
Per Tool Use Hook：记录每次工具使用，用于研究和文档化
Stop Hook：长任务结束时自动让 Codex 继续执行下一轮

这三个 Hook 组合起来，基本实现了 AI 的"永动机"模式。Stop Hook 让 Codex 任务结束后自动开始下一轮，这不就是 while True 循环的人形版本吗？对 AI 的工作强度来说，这属于 996 都不敢想的 007。

其他值得关注的功能

Personality 个性化：可以设置友好型或务实型人格——终于，你可以选择 AI 是温柔地告诉你代码有 bug，还是直接甩你一脸
Codex Security：逐 commit 扫描并修复 GitHub 项目漏洞，让安全团队终于可以睡个好觉
Cloud Agent 支持：可从本地切换到云端执行，支持 Best-of-N 并行运行——让多个 AI 赛马，选最好的结果，简单粗暴但有效
会话数据存储在 .codex/.sessions 文件夹中，可被 Codex 扫描分析用于优化

目前云端任务还不支持 Sub Agents 和本地 Skills 执行（出于安全考虑），但已经在路线图中。看来 OpenAI 自己也知道，放一群 AI 在云上自由奔跑是什么画面。

写在最后

Codex 已经不是在帮你写代码了，它是在帮你经营一家公司——而你唯一需要做的，就是确保自己还记得密码。

从 Plugins 到 Automations，从 Sub Agents 到 Garden Approvals，OpenAI Codex 正在从一个编程工具进化成一个全方位的软件工程操作系统。300 万周活跃用户只是开始，当这些前沿功能全部稳定落地，软件开发的工作方式会被彻底重新定义。

本文基于 OpenAI Codex 大师课视频内容整理，由 Vaibhav Srivastav 与 Katia Gil Guzman 主讲。

OpenAI Codex 大师课完整解析：从插件系统到Sub Agent，一文吃透AI编程Agent的全部能力

OpenAI Codex 大师课完整解析：从插件系统到Sub Agent，一文吃透AI编程Agent的全部能力

Codex 到底是什么？不只是代码补全工具

模型演进：版本号更新比换手机壳还快

Codex App：你梦寐以求的完美同事

Plugins 插件系统：乐高积木遇上企业级中间件

Automations 自动化：你一直想雇但雇不起的私人助理

实战演示：2 分钟同步 57 个文件，1 小时从零做出游戏

Google Drive 数据同步

平台跳跃游戏开发

Code Review 代码审查：AI 面前人人平等

Sub Agents 子代理：一个人干一群人的活

前沿实验功能：Garden Approvals 与 Hooks

Garden Approvals：用 AI 监督 AI

Hooks 钩子系统

其他值得关注的功能

写在最后

相关推荐

OpenClaw开源小龙虾AI Agent运作原理深度解析

Transformer本质解析：一个被拆解的文字接龙函数

Claude Code与普通AI对话的五大核心差异