OpenAI Codex 大师课完整解析:从插件系统到Sub Agent,一文吃透AI编程Agent的全部能力

OpenAI Codex 大师课完整解析:从插件系统到Sub Agent,一文吃透AI编程Agent的全部能力
当一个AI不仅能写代码还能帮你回邮件、审PR、做游戏,你开始怀疑自己的工位是不是快要被一个沙箱取代了。这篇文章基于OpenAI伦敦团队带来的 OpenAI Codex 大师课,由 Vaibhav Srivastav 和 Katia Gil Guzman 主讲,把 Codex 从底层架构到前沿实验功能全部拆了个底朝天。如果你在用 Codex 或者正打算上手,这篇值得收藏。
Codex 到底是什么?不只是代码补全工具
OpenAI Codex 是一个完整的软件工程 Agent。注意,不是代码补全,不是聊天机器人——是 Agent。它能写代码、跑命令、执行测试、探索整个代码库,甚至连接 Figma、Linear、Notion 这些第三方工具。
底层架构上,Codex 基于 GPT 5.3 Codex、GPT 5.4 等模型,上面套了一层统一的 Agent Harness,负责管理工具执行、环境设置和安全策略。翻译成人话就是:给 AI 套了个安全笼子,让它干活但别让它把服务器删了。
交互方式也够多样——Codex App、IDE 扩展、CLI、Slack、GitHub,你在哪它就在哪。这哪是个编程助手,这分明是个全栈实习生,而且不要工资、不摸鱼、不在 Slack 上发表情包。
模型演进:版本号更新比换手机壳还快

Codex 的模型迭代路线相当激进:
- GPT 5.2 → GPT 5.2 Codex → GPT 5.3 Codex → GPT 5.3 Codex Spark(与 Cerebras 合作)→ GPT 5.4
- 同时发布了 GPT 5.4 Mini 和 GPT 5.4 Nano,分别用于短任务和 Sub Agents
性能方面的提升也很实在:
- 引入 WebSockets 实现约 1.75 倍 token 处理速度提升
- Fast Mode 在此基础上再翻一倍
合着以前的速度是故意慢的?
用户数据更能说明问题:Codex 已经突破 300 万周活跃用户,自今年 1 月以来增长超 3 倍。这增长曲线让任何 SaaS 创始人看了都会流泪。不过话说回来,当你的产品能替人写代码,用户增长不快才奇怪。
Codex App:你梦寐以求的完美同事
Codex App 的核心能力包括:
- 跨项目工作和同一项目内多功能并行开发
- 原生 Git Work Tree 支持——终于不用在十个分支之间反复横跳了,上下文切换的痛苦只有程序员懂
- Automations 自动化任务(类似 cron job)——本质上就是给 AI 装了个闹钟:到点了,干活
- 原生 Windows 支持,包含原生 Windows 沙箱(号称业界首创)——Windows 用户终于不再是二等公民了
最新发布的功能按时间排序包括:Plugins、Mini Models、Code Review、Security 等。每一个都值得单独拿出来说。
Plugins 插件系统:乐高积木遇上企业级中间件
Codex 的 Plugins 系统把三样东西打包成了可复用的工作流:
| 组件 | 作用 | 举例 |
|---|---|---|
| Skills | 可复用的指令包 | 自动创建,避免重复操作 |
| Apps | 连接第三方服务 | Notion、Linear、Google Drive |
| MCP Servers | 外部工具扩展 | 暴露外部系统能力给 Codex |
最妙的是 Skills 可以让 Codex 自动创建——AI 自己给自己写说明书,这是什么级别的自我管理?你既可以用官方提供的插件,也可以创建自定义插件。感觉 Codex 正在悄悄地把自己变成所有 SaaS 产品的超级入口。
Automations 自动化:你一直想雇但雇不起的私人助理

Automations 功能是这次大师课里最让人兴奋的部分之一。看看这些实际用例:
- Slack 自动分类:每天早上 9 点自动检查 Slack 消息,按紧急程度分类标记
- Gmail 自动化:筛选需要回复的邮件,判断时效性和合法性——终于有人替你过滤那些"恭喜你中了五百万"的邮件了
- 支持对话式创建:直接告诉 Codex 你想要什么自动化,它自己搞定配置
- 可以设置运行频率、关联项目、连接各种 Apps 和 Plugins
演讲者 Katia 说这功能每天帮她省好几个小时。我信,因为光是处理 Slack 未读消息就够喝一壶的了。
实战演示:2 分钟同步 57 个文件,1 小时从零做出游戏
大师课上有两个演示直接把现场气氛拉满了。
Google Drive 数据同步
用 Google Drive 插件让 Codex 读取代码库中 57 个 YAML 事件文件,然后自动更新到 Google Sheets 表格。整个过程耗时 2 分钟。我手动做这事大概需要 2 小时外加 3 杯咖啡。
平台跳跃游戏开发
这个才是真正炸裂的。使用 Games Studio 插件(包含 Image Gen 和 Playwright Interactive 技能),只需要一句提示词——"做一个砖块平台跳跃游戏":
- Image Gen 自动生成游戏精灵图等视觉素材
- Playwright Interactive 作为无头浏览器让 Codex 可视化调试
- 完整游戏从零构建约 1 小时
这已经不是辅助编程了,这是 AI 在独立创业。独立游戏开发者看到这里,心情大概比较复杂。
Code Review 代码审查:AI 面前人人平等

Codex Code Review 被认为是业界最好的代码审查工具之一,核心能力包括:
- 在 GitHub 上自动审查每个 PR,按 P0/P1/P2 优先级标注问题
- 审查不只看 diff,还会分析整个仓库上下文,发现二阶效应影响
- 支持通过
/review命令在 CLI 或 App 中触发
一个关键细节:OpenAI 内部 100% 的 PR(包括 Greg 的)默认由 Codex Code Review 审查。这说明什么?说明在 AI 面前人人平等,管你是谁的代码都得过机器这一关。毕竟 AI 不会因为快下班了就草草 approve。
最骚的操作是他们还发布了 Claude Code 插件——让竞争对手的用户也能用自家的审查服务。这商业格局属实大气。
Sub Agents 子代理:一个人干一群人的活

Sub Agents 系统是 Codex 最强大的能力之一。它可以把主任务分解为可并行的独立子任务,分配给多个 Agent 同时执行。
演示中,20 个 Sub Agent 并行审查 45 个 Agent persona 文件,系统自动启用 Plan Mode 分解为 5 个子任务。
默认提供三种 Sub Agent 人格,简直就是 RPG 游戏里的职业分工:
| 人格类型 | 定位 | 适用场景 |
|---|---|---|
| Default | 通用型 | 常规任务 |
| Worker | 执行导向 | 明确的实现任务 |
| Explorer | 探索导向 | 调研、分析、方案探索 |
每个 Sub Agent 还能自定义模型、推理强度、沙箱模式(读写/只读),可以配置 MCP 访问(如 Sentry、Linear)和 Skills。配置自由度比组装电脑还高。
更厉害的是,你可以让 Codex 分析历史会话自动推荐创建 Sub Agent。AI 开始学会自我复制了,这剧情走向有点赛博朋克。
实际应用场景包括:网络安全漏洞分析、功能方案头脑风暴、测试运行等。
前沿实验功能:Garden Approvals 与 Hooks

Garden Approvals:用 AI 监督 AI
YOLO 模式的名字起得很诚实——确实是"你只活一次",因为给 AI 全权限搞不好服务器也只活一次。
Garden Approvals 的解决方案很优雅:当 Codex 需要执行特权操作(删目录、启服务器、暴露文件)时,自动启动一个 Sub Agent 来验证操作的安全性。大多数情况下无需人工干预,有效减少人工审批疲劳。
本质上就是 AI 界的"谁来监督监督者"问题,答案是:再来一个监督者。套娃式安全架构,但确实管用。
Hooks 钩子系统
支持三种 Hooks,通过 hooks.json 配置文件和 Python 脚本实现:
- Start Hook:会话开始时自动从 GitHub 拉取最新代码
- Per Tool Use Hook:记录每次工具使用,用于研究和文档化
- Stop Hook:长任务结束时自动让 Codex 继续执行下一轮
这三个 Hook 组合起来,基本实现了 AI 的"永动机"模式。Stop Hook 让 Codex 任务结束后自动开始下一轮,这不就是 while True 循环的人形版本吗?对 AI 的工作强度来说,这属于 996 都不敢想的 007。
其他值得关注的功能
- Personality 个性化:可以设置友好型或务实型人格——终于,你可以选择 AI 是温柔地告诉你代码有 bug,还是直接甩你一脸
- Codex Security:逐 commit 扫描并修复 GitHub 项目漏洞,让安全团队终于可以睡个好觉
- Cloud Agent 支持:可从本地切换到云端执行,支持 Best-of-N 并行运行——让多个 AI 赛马,选最好的结果,简单粗暴但有效
- 会话数据存储在
.codex/.sessions文件夹中,可被 Codex 扫描分析用于优化
目前云端任务还不支持 Sub Agents 和本地 Skills 执行(出于安全考虑),但已经在路线图中。看来 OpenAI 自己也知道,放一群 AI 在云上自由奔跑是什么画面。
写在最后
Codex 已经不是在帮你写代码了,它是在帮你经营一家公司——而你唯一需要做的,就是确保自己还记得密码。
从 Plugins 到 Automations,从 Sub Agents 到 Garden Approvals,OpenAI Codex 正在从一个编程工具进化成一个全方位的软件工程操作系统。300 万周活跃用户只是开始,当这些前沿功能全部稳定落地,软件开发的工作方式会被彻底重新定义。
本文基于 OpenAI Codex 大师课 视频内容整理,由 Vaibhav Srivastav 与 Katia Gil Guzman 主讲。
相关推荐
深度解读OpenClaw开源小龙虾AI Agent运作原理深度解析
深度解析OpenClaw(开源小龙虾)AI Agent的底层运作原理,涵盖System Prompt、工具调用、SubAgent分身、Skill系统、记忆机制与Context Engineering等核心概念,帮你彻底理解AI Agent与普通语言模型的本质区别。
深度解读Transformer本质解析:一个被拆解的文字接龙函数
用文字接龙的视角理解Transformer本质。将复杂的语言生成任务拆解为Embedding、Transformer Block、概率输出三大模块,帮助深度学习初学者快速建立直觉。
深度解读Claude Code与普通AI对话的五大核心差异
详细对比Claude Code与普通AI对话工具在交互方式、上下文理解、执行力、记忆能力和工具调用五个维度的核心差异,帮你理解AI编程助手的真正价值。