Codex不只是写代码：OpenAI智能体重塑知识工作全解析

在最新一期 OpenAI Forum 中，Codex 负责人 Thibaut Sautil 与主持人 Chris Nicholson 进行了一场深度对话，揭示了一个令人意外的事实：Codex 上大多数任务已经不再是编程任务。这款最初为开发者打造的 AI 智能体工具，正在悄然改变研究人员、设计师、财务人员、市场营销人员乃至小企业主的工作方式。

从云端代码工具到本地通用智能体

起步：一个过于超前的构想

Codex 的旅程始于大约两年前。最初的版本被称为「Codex Web」——用户在云端 Web 界面提交任务，Codex 会自动查看代码仓库、分析需要的变更，然后在 GitHub 上提交 Pull Request。Pull Request（简称 PR）是现代软件开发中基于 Git 版本控制系统的核心协作机制——开发者完成代码修改后，不会直接合并到主分支，而是创建一个 PR 邀请团队成员进行代码审查，确认无误后才批准合并。Codex 最初的设计就是自动完成从代码分析到提交 PR 的全流程，本质上是将一个初级开发者的日常工作自动化。整个流程完全隔离、完全打包，用户只需表达意图即可。

但团队很快发现了问题：摩擦太大。开发者在自己的电脑上有精心配置的开发环境，要在云端复现这一切非常困难。加上当时模型的可靠性不足以处理长周期任务，这条路走不通。

转折：GPT-5 带来的质变

真正的转折发生在最近六个月。随着 GPT-5 的发布，模型在通用性和可靠性上实现了阶跃式提升，尤其是 5.2 版本在长周期任务上的表现大幅改善。所谓「长周期任务」，是指那些需要在较长时间跨度内保持目标一致性、记住多步骤中间状态、并根据反馈动态调整策略的复杂任务。此前的大语言模型在处理这类任务时容易出现「目标漂移」——即在多轮交互后偏离最初意图。GPT-5.2 通过改进的注意力机制和更长的有效上下文窗口，显著缓解了这一问题，使得 AI 智能体能够可靠地执行跨越数小时甚至数天的工作流。

Thibaut 指出了一个常被忽视的事实：即便是软件工程师，真正写代码的时间也只占 20-30%。大部分时间花在理解系统架构、处理工单、调查 Bug 报告、处理线上故障、参与讨论和做决策上。

Codex技术能力已达到通用工作水平

当 Codex 开始接入 Notion、Slack 等信息源以提升编码效果时，团队意识到他们手中掌握的技术远比一个编码工具更强大——它本质上是一个通用的 AI 智能体平台。这里所说的 AI 智能体（AI Agent），与传统的聊天机器人有本质区别。聊天机器人是被动响应式的——用户提问，模型回答。而 AI 智能体具备自主规划、工具调用和环境感知能力，能将复杂目标分解为多个子任务，依次调用不同的外部工具（如搜索引擎、数据库、API 接口）来完成每个子任务，并根据中间结果动态调整后续计划。这种「感知-规划-行动-反馈」的循环机制，使得智能体能够处理开放式的、非结构化的真实世界任务。

「顿悟时刻」：产品经理的超级生产力

让 Thibaut 真正意识到 Codex 潜力的，是一次产品发布前的经历。Codex 的首席产品经理 Alexander Miracles 在准备发布时，同时运行着多个 Codex 智能体：有的在追踪各项变更的状态，有的在 Slack 上向同事催促进度，有的在汇总用户反馈并更新文档。

「Alexander 一边和我开会讨论，他的 Codex 智能体们一边在后台工作——追人、汇总信息、维护发布计划。我从没见过一个人能这么高效。那一刻我意识到，我们改变的不只是软件工程。」

在 Codex 之前，这些工作意味着手动翻阅 Slack 频道、搜索文档、查看 GitHub PR——每个知识工作者都深知这种协调工作有多耗时。而现在，这些耗时的工作被委托给了 AI 智能体，它们在你开会的时候就把活干完了。

Codex如何改变日常工作流

个人「参谋长」模式：AI自动化的实战应用

Thibaut 本人每天向 Codex 发送超过 100 个任务。他展示了自己的典型用法：

每日简报自动化：设定每天早上 9 点自动扫描 Gmail、Notion、日历，生成当日摘要并标记风险项
团队状态追踪：了解值班轮换情况、工程师状态、即将到来的发布计划
个性化新闻推送：根据个人兴趣定制的新闻报告
文件管理：自动整理桌面文件

Codex作为个人参谋长的自动化工作流

他坦言，很多事情并非「以前要花很久，现在很快」，而是**「以前根本不会去做，因为觉得不值得麻烦别人，现在终于可以做了」**。这种从「无限时间」到「几分钟」的跨越，才是 AI 生产力工具带来的最深刻变化。

面包地图：个人软件的诞生

Thibaut 现场演示了一个生动的例子。作为从欧洲搬到旧金山的面包爱好者，他觉得当地面包价格离谱，于是用语音告诉 Codex：「我在旧金山，我很喜欢面包，帮我找到所有能买到的面包，做一张地图，标上价格和说明。」

五分钟后，Codex 生成了一个完整的电子表格，列出了 Jane the Bakery、Tartine、Arsicault 等面包店的品种、描述和价格。他又追加一句「做成网页」，四分钟后一个带交互地图的网站就出现了。想加上咖啡信息？再说一句话就行。

这就是「个人软件」的时代——每个人都能为自己的具体需求创建定制化工具，不需要懂任何代码。这一概念代表了软件开发民主化的最新阶段。传统软件开发遵循「需求分析-设计-编码-测试-部署」的完整流程，即使是最简单的应用也需要专业开发者投入数天时间。而在 AI 智能体时代，用户只需用自然语言描述需求，AI 就能在几分钟内生成完整的可运行应用。这与 Andrej Karpathy 提出的「Software 2.0」理念一脉相承——编程的本质正在从编写代码转变为描述意图。这正是 AI 办公自动化最直观的体现。

企业采用的关键挑战：信任与安全

面对社区提问「企业采用的最大瓶颈是什么」，Thibaut 明确表示不是模型能力，而是信任。

核心担忧在于：如果一个 AI 智能体在公司内部自由行动，可能删除敏感文件、泄露机密信息、发送不当邮件。为此，OpenAI 采取了多重安全措施：

沙盒机制：智能体默认在受限环境中运行，只能访问指定文件夹，可以禁用网络访问。沙盒（Sandbox）是计算机安全领域的经典概念，通过操作系统级别的隔离技术（如容器化、虚拟机、文件系统权限控制）将程序的运行环境与宿主系统完全隔离。即使沙盒内的程序出现恶意行为或严重错误，也无法访问沙盒外的文件、网络资源或系统权限。这意味着企业管理员可以精确控制智能体能访问哪些数据源、能执行哪些操作。
企业级权限控制：类似于公司内部的信息分级制度，可以设置只读权限
Auto Review（自动审查）：一个独立的「裁判」智能体实时审查主智能体的每个操作，遇到高风险行为立即叫停。这体现了 AI 安全领域中「多智能体监督」的设计理念——不依赖单一智能体的自我约束，而是引入独立的监督智能体进行实时风险评估。这类似于金融行业中的「四眼原则」（Four-Eyes Principle），重要操作必须经过至少两个独立主体的确认。监督智能体会检查主智能体是否访问了超出权限的数据、是否执行了可能造成不可逆后果的操作（如删除文件、发送邮件），这种「AI 监督 AI」的架构也是当前 AI 对齐（AI Alignment）研究的重要实践方向之一。

Codex的精确指令与输出规范

这套安全机制让企业能够在可控范围内逐步扩大 AI 智能体的权限，而非一步到位地全面放开。

使用Codex的关键技巧

像带新人一样给指令

Thibaut 建议用户把 Codex 当作一个刚入职的聪明同事：它什么都不知道，但学得很快。你需要告诉它：

精确描述期望输出：比如「做一个 10 页的演示文稿，前两页放概述，中间六页做技术分析，最后两页放开放问题」
定义成功标准：帮助它评估自己是否完成了任务
连接尽可能多的信息源：Codex 已有超过 100 个插件，连接日历、文档、Notion 等工具越多，效果越好
把脑中的想法写下来：Thibaut 自己养成了把目标、想法写成文件的习惯，让 Codex 也能读取

避免最大误区：过度委托

避免过度委托，保持自身理解

最值得警惕的错误是把所有事情都甩给 Codex，包括你自己的理解。如果你不再亲自理解问题，最终会失去判断力和生产力。Thibaut 建议多用 Codex 来帮助自己学习——让它画图解释概念、生成知识摘要、甚至用 Images V2 渲染带文字的解释性图片。

「做工作的人才是学到东西的人。」

未来展望：永不停歇的AI智能体

/goal 模式：从分钟级响应到数周持续工作

Codex 新推出的 /goal 命令允许用户设定长期目标，智能体会持续工作数小时、数天甚至数周，直到目标达成。这代表了 AI 智能体从「工具」向「自主代理」演进的关键一步。传统的 AI 交互是同步的——用户发出指令，等待结果返回。而 /goal 模式是异步的，智能体在后台持续运行，遇到障碍时自主寻找解决方案，必要时才向用户请求输入。这对底层技术提出了极高要求：智能体需要具备长期记忆管理能力（避免在数天的工作中遗忘关键上下文）、错误恢复能力（在某个子任务失败时自动回退并尝试替代方案）、以及资源管理能力（合理分配计算资源和 API 调用配额）。这也是为什么 GPT-5 在长周期任务上的可靠性提升对 /goal 模式至关重要。

已有用户用它完成了数学突破、物理研究、大规模程序重写等任务。这标志着 AI 智能体从「即时响应」向「持续自主工作」的重大转变。

从任务驱动到持续运行

Thibaut 描绘的终极愿景是：AI 智能体不再是「接受任务-完成任务」的模式，而是 24/7 持续运行，主动发现有价值的工作去做。你甚至不需要阅读邮件——智能体会帮你读，只在真正重要的事情上请求你的输入。

「你不再需要在十几个不同的应用里大海捞针。针已经被整理好了，放在你的晨间简报里。」

结语

正如 Chris Nicholson 在结尾提醒的，虽然 Codex 这个名字里有「code」，但 Codex 的本义是「书」——一个远比代码更通用的概念。这场对话传递的核心信息是：OpenAI Codex 正在从一个开发者工具演变为一个通用的知识工作加速器。它不是要取代人类的思考，而是要解放人类的注意力，让每个人都能专注于真正值得思考的事情。

对于任何知识工作者来说，现在就是尝试的最佳时机。想一个你工作中最耗时、最琐碎的流程，把它交给 Codex 试试看。你可能会发现，那些你以为「永远没时间做」的事情，突然变得触手可及。

从云端代码工具到本地通用智能体

起步：一个过于超前的构想

转折：GPT-5 带来的质变

Codex技术能力已达到通用工作水平

「顿悟时刻」：产品经理的超级生产力

「Alexander 一边和我开会讨论，他的 Codex 智能体们一边在后台工作——追人、汇总信息、维护发布计划。我从没见过一个人能这么高效。那一刻我意识到，我们改变的不只是软件工程。」

Codex如何改变日常工作流

个人「参谋长」模式：AI自动化的实战应用

Thibaut 本人每天向 Codex 发送超过 100 个任务。他展示了自己的典型用法：

每日简报自动化：设定每天早上 9 点自动扫描 Gmail、Notion、日历，生成当日摘要并标记风险项
团队状态追踪：了解值班轮换情况、工程师状态、即将到来的发布计划
个性化新闻推送：根据个人兴趣定制的新闻报告
文件管理：自动整理桌面文件

Codex作为个人参谋长的自动化工作流

面包地图：个人软件的诞生

企业采用的关键挑战：信任与安全

面对社区提问「企业采用的最大瓶颈是什么」，Thibaut 明确表示不是模型能力，而是信任。

核心担忧在于：如果一个 AI 智能体在公司内部自由行动，可能删除敏感文件、泄露机密信息、发送不当邮件。为此，OpenAI 采取了多重安全措施：

沙盒机制：智能体默认在受限环境中运行，只能访问指定文件夹，可以禁用网络访问。沙盒（Sandbox）是计算机安全领域的经典概念，通过操作系统级别的隔离技术（如容器化、虚拟机、文件系统权限控制）将程序的运行环境与宿主系统完全隔离。即使沙盒内的程序出现恶意行为或严重错误，也无法访问沙盒外的文件、网络资源或系统权限。这意味着企业管理员可以精确控制智能体能访问哪些数据源、能执行哪些操作。
企业级权限控制：类似于公司内部的信息分级制度，可以设置只读权限
Auto Review（自动审查）：一个独立的「裁判」智能体实时审查主智能体的每个操作，遇到高风险行为立即叫停。这体现了 AI 安全领域中「多智能体监督」的设计理念——不依赖单一智能体的自我约束，而是引入独立的监督智能体进行实时风险评估。这类似于金融行业中的「四眼原则」（Four-Eyes Principle），重要操作必须经过至少两个独立主体的确认。监督智能体会检查主智能体是否访问了超出权限的数据、是否执行了可能造成不可逆后果的操作（如删除文件、发送邮件），这种「AI 监督 AI」的架构也是当前 AI 对齐（AI Alignment）研究的重要实践方向之一。

Codex的精确指令与输出规范

这套安全机制让企业能够在可控范围内逐步扩大 AI 智能体的权限，而非一步到位地全面放开。

使用Codex的关键技巧

像带新人一样给指令

Thibaut 建议用户把 Codex 当作一个刚入职的聪明同事：它什么都不知道，但学得很快。你需要告诉它：

精确描述期望输出：比如「做一个 10 页的演示文稿，前两页放概述，中间六页做技术分析，最后两页放开放问题」
定义成功标准：帮助它评估自己是否完成了任务
连接尽可能多的信息源：Codex 已有超过 100 个插件，连接日历、文档、Notion 等工具越多，效果越好
把脑中的想法写下来：Thibaut 自己养成了把目标、想法写成文件的习惯，让 Codex 也能读取

避免最大误区：过度委托

避免过度委托，保持自身理解

「做工作的人才是学到东西的人。」

未来展望：永不停歇的AI智能体

/goal 模式：从分钟级响应到数周持续工作

已有用户用它完成了数学突破、物理研究、大规模程序重写等任务。这标志着 AI 智能体从「即时响应」向「持续自主工作」的重大转变。

从任务驱动到持续运行

「你不再需要在十几个不同的应用里大海捞针。针已经被整理好了，放在你的晨间简报里。」

Codex不只是写代码：OpenAI智能体重塑知识工作全解析

从云端代码工具到本地通用智能体

起步：一个过于超前的构想

转折：GPT-5 带来的质变

「顿悟时刻」：产品经理的超级生产力

Codex如何改变日常工作流

个人「参谋长」模式：AI自动化的实战应用

面包地图：个人软件的诞生

企业采用的关键挑战：信任与安全

使用Codex的关键技巧

像带新人一样给指令

避免最大误区：过度委托

未来展望：永不停歇的AI智能体

/goal 模式：从分钟级响应到数周持续工作

从任务驱动到持续运行

结语

相关推荐

OpenClaw开源小龙虾AI Agent运作原理深度解析

Transformer本质解析：一个被拆解的文字接龙函数

Claude Code与普通AI对话的五大核心差异

Codex不只是写代码：OpenAI智能体重塑知识工作全解析

从云端代码工具到本地通用智能体

起步：一个过于超前的构想

转折：GPT-5 带来的质变

「顿悟时刻」：产品经理的超级生产力

Codex如何改变日常工作流

个人「参谋长」模式：AI自动化的实战应用

面包地图：个人软件的诞生

企业采用的关键挑战：信任与安全

使用Codex的关键技巧

像带新人一样给指令

避免最大误区：过度委托

未来展望：永不停歇的AI智能体

/goal 模式：从分钟级响应到数周持续工作

从任务驱动到持续运行

结语

相关推荐

OpenClaw开源小龙虾AI Agent运作原理深度解析

Transformer本质解析：一个被拆解的文字接龙函数

Claude Code与普通AI对话的五大核心差异