Codex新手教程:五步上手OpenAI编程助手(2025实操指南)

Codex不是聊天框,而是能自主推进项目的AI编程同事,核心在于Plan Mode。
文章重新定义了Codex的本质:它不是问答式AI助手,而是具备感知-规划-执行闭环能力的AI Agent,能读写文件、执行命令并持续推进多步骤任务。文章提供了五步上手路线,强调文件夹与Thread的分离管理原则,介绍了规则、权限、Skills三个关键设置,并将Plan Mode(先规划后执行)作为最核心的功能推荐,帮助用户避免AI改崩项目的风险。
重新认识Codex:不是聊天框,而是AI编程同事
很多人第一次打开Codex,以为它只是一个会写代码的聊天框。这个理解大错特错。
对新手来说,Codex真正重要的地方在于——它能进入你的项目文件夹,围绕一个目标持续推进,把结果落到实际文件里。普通AI助手更像顾问,你问一句它答一句;而Codex更像同事,你给它一个项目、一个目标、一个权限边界,它可以把任务拆开,然后一步步推进。
这种差异源于架构层面的根本不同。Codex属于「AI Agent」范畴,具备「感知-规划-执行」的完整闭环能力:它能读写文件系统、执行终端命令、调用外部工具,并在多个步骤之间保持上下文连贯性。这种架构让Codex可以自主完成「打开文件→分析代码→修改→验证→提交」这样的完整工作流,而不需要用户在每个步骤之间手动传递信息。传统对话AI每次响应相互独立,无法主动操作外部环境;Codex则能像真正的同事一样,持续推进一个多步骤的目标直到完成。
这种差异决定了使用Codex的方式和使用ChatGPT完全不同。你不需要追最新的模型名,也不需要找什么"神提示词",而是要先搞懂它的工作方式。
Codex工作台界面与五步上手路线
新手第一步是认识Codex的界面布局:左边是项目和Thread(任务线程),中间是任务推进过程,结果会直接落在你的项目文件里。

小白上手五步路线
整个上手路线可以压缩成五步:
- 安装登录:下载安装本身不难,但要记住入口、账号、模型、权限都会随时间变化,教程只能帮你建立路径感,最终以你账号里真实能看到的页面为准。
- 添加项目文件夹:把学习资料、真实项目、沙盒测试、通用工具分开管理。
- 新建Thread:在对应文件夹里开启具体任务线程。
- 用一句话说清楚目标:目标要具体——做什么、给谁用、改哪里、怎么验收。
- 让它先列计划,不要一上来就直接改:这是最关键的一步。
文件夹与Thread:Codex项目管理的黄金法则
很多新手越用越乱,不是Codex不行,而是文件夹一开始就没有规划好。
你可以把文件夹理解成项目群,把Thread理解成群里的一个具体话题帖。黄金法则只有一句:
同一个文件夹里做同一个大方向,同一个Thread里只推进一件具体的事。

理解这条法则,需要知道Thread在技术层面的含义。每个Thread维护自己独立的对话历史、文件操作记录和中间状态,不同Thread之间的AI「记忆」是完全隔离的。这一设计借鉴了软件工程中「关注点分离」的原则——就像Git中不同分支处理不同功能一样,Thread隔离能防止不同任务的上下文相互污染,避免AI在处理A任务时「想起」B任务的错误逻辑。
不要上午改网页、下午算表格、晚上写文案,全塞进同一条任务线。多个Thread可以并行推进,但前提是目标拆得清楚。比如一个Thread改首页,一个Thread写文档,一个Thread做数据脚本——不要让它们抢同一批文件。
三个关键设置:规则、权限与技能配置
设置部分先抓三件事:
1. Generally:允许后台运行
这是基础配置,确保Codex能在后台持续推进任务,不会因为你切换窗口就中断工作流。
2. Personalization:写清协作规则
Personalization本质上就是图形界面的项目规则。你要告诉Codex几个核心原则:
- 改动要小,动手前先说计划
- 不要胡编路径,不要泄露密钥
- 改完要告诉你最小检查命令
权限模式按风险选择,别为了图快把重要目录随便交给全权限。
3. Skills:沉淀固定的做事方法
Skills是新手最容易低估的部分。它不是炫技插件,而是把固定的做事方法沉淀下来——写作、调研、生成图文、代码检查,都可以变成可复用的能力模块。
Skills功能背后涉及「工具调用」(Tool Use/Function Calling)技术,这是现代大语言模型的重要能力扩展。通过预定义的技能模块,Codex可以在需要时调用特定的外部能力,而不是每次从零开始推理。MCP(Model Context Protocol)是一套开放协议标准,旨在统一AI模型与外部工具、数据源之间的接口规范,类似于USB接口之于硬件设备的意义——让不同来源的工具能以标准化方式接入AI系统。一旦某种工作方法被封装为Skill,就可以在不同项目中一键调用,避免重复配置的成本。

定时任务、MCP、记忆系统、电脑自动化都很强,但新手不要第一天全开。正确的学习顺序是:
- 先会文件夹和Thread
- 再会规则和Diff
- 最后再接工具和自动化
Plan Mode:Codex最值得记住的核心功能
如果整个教程只让你记住一个功能,那就是Plan Mode。
它的价值是:先让Codex只规划、不动代码,等你确认计划合理,再允许它执行。这一步能避免绝大多数"AI改崩项目"的灾难。
Plan Mode本质上是将AI的「推理阶段」和「执行阶段」强制解耦,这与软件工程中的「设计评审」机制高度同构。在没有Plan Mode的情况下,AI会将规划和执行混在一起,一旦早期判断出现偏差,后续所有操作都会在错误路径上叠加,形成难以回滚的「蝴蝶效应」。Plan Mode强制AI先输出可审查的自然语言计划,人类在这一环节介入,相当于在代码被写入之前就完成了「架构评审」。研究表明,错误在需求和设计阶段被发现的修复成本,仅为代码阶段的1/10到1/100,Plan Mode正是将这一工程学原则引入AI协作流程。
日常控制Codex有三个入口:
- 斜杠命令:快速触发特定操作
- Status查看:了解当前任务进度
- 推理深度调节:简单任务用低推理深度,复杂任务切到High或Extra High
养成"先看计划再放手"的习惯,能让你在使用AI编程工具时少踩90%的坑。
Web Coding实战:从写代码到描述需求
真正开始用Codex做Web开发后,门槛会从"会不会写代码"变成"会不会描述需求
相关推荐
教程攻略Cursor+Codex双IDE协同:开源项目二开实战方法论
基于实战经验总结的开源项目二次开发完整方法论,详解Cursor+Codex双IDE协同工作流,涵盖二开七环节、MVP验证、AI读源码技巧,帮助开发者三天跑通项目、两周完成业务集成。
教程攻略Cursor多Agent实战:50分钟搭建Next.js全栈博客
使用Cursor IDE多Agent协作模式,50分钟内从零搭建全栈博客。涵盖Next.js、Clerk认证、Supabase数据库集成,详解4个AI Agent分阶段开发流程与关键避坑经验。
教程攻略从零搭建AI软件工厂:Cursor工程师的多Agent协作实战经验
Cursor工程师Eric分享AI软件工厂构建实战:从自动化六层级、护栏设计、并行Agent管理到规模化扩展,详解如何用多Agent协作实现7×24小时高效软件开发。