OpenAI Codex App深度评测：Streets并行开发与五大核心特性解析

OpenAI近日推出了桌面版AI编程工具Codex App，这是从Codex命令行工具升级而来的图形化编程应用。目前仅支持Mac平台，Windows和Linux版本正在开发中。本文将从Streets、Git集成、技能系统、自动化和MCP五个维度，全面解析这款工具的特性与实际使用体验。

或者是master分支

你的这个项目里面去

让它去创建技能

Codex的进化：从命令行到桌面应用

在Codex App之前，开发者使用Codex主要有三种方式：通过Web端对话编程、通过终端命令行操作（使用最广泛），以及在VS Code中安装插件使用。Codex App则是一个独立的桌面客户端，首次打开时会自动加载此前通过其他方式使用过的工程目录。

你可能没注意到，Codex App的设计理念与传统IDE截然不同——你在界面中看不到任何项目文件和代码。它采用的是"对话式编程"范式，开发者只需关注对话内容和Git变更记录，而非直接操作代码文件。

对话式编程（Conversational Programming）是近年来随着大语言模型能力提升而兴起的一种新型人机交互范式。传统IDE以文件树、代码编辑器和终端为核心界面元素，开发者需要直接操作源代码文件。而对话式编程将交互层级提升到自然语言层面，开发者通过描述意图来驱动代码生成。这一理念最早可追溯到自然语言编程（Natural Language Programming）的学术研究，但直到GPT-4级别的模型出现后才真正具备实用价值。Codex App的设计选择——完全隐藏文件树和代码编辑器——是这一范式最激进的实践之一，它假设开发者的核心价值在于需求定义和架构决策，而非逐行编写代码。

这种设计虽然激进，但指向了一个值得关注的方向：让开发者从"写代码"转向"描述需求"。

Streets：基于特性的并行开发模式

Streets是Codex App的核心交互单元，可以理解为一个以"功能特性"为中心的独立对话空间。当你要为项目开发某个功能时，可以新开一个Street，在其中与AI进行对话来完成开发。

每个Street的第一条消息会自动成为其标题，你也可以手动修改以便于识别。比如创建一个"增加验证码"的Street，再创建一个"增加搜索框"的Street，两者可以同时并行运行。这种并行任务执行能力是Codex App区别于其他AI编程工具的一大亮点。

Streets还支持多种实用功能：

模型选择：默认使用o3模型，也可切换到o4-mini等不同尺寸的模型。o3和o4-mini是OpenAI推出的推理模型系列，与传统的GPT系列模型不同，o系列模型采用了"思维链"（Chain-of-Thought）推理机制，在生成最终答案前会进行内部推理步骤。o3是该系列中能力最强的模型，擅长处理复杂的多步骤编程任务、数学推理和代码架构设计；o4-mini则是轻量化版本，在保持较高代码生成质量的同时大幅降低了推理延迟和计算成本。简单的代码修改用o4-mini即可快速完成，而涉及复杂重构或架构设计的任务则更适合使用o3。
Plan模式：适合复杂功能开发，AI会先分析现有代码并输出计划文档，再按计划逐步实现。可通过快捷键Ctrl+Tab快速切换。Plan模式的设计理念源自软件工程中"先设计后实现"的最佳实践——在大型功能开发中，直接编码往往会导致架构混乱和返工，而先制定实施计划可以帮助开发者和AI对齐预期，确保实现路径的合理性。这也为开发者提供了一个审查和修正AI理解的机会，避免AI在错误方向上投入大量计算资源。
权限控制：默认需要手动确认权限，双击可开启全部权限的自动模式。权限控制是AI编程工具安全性设计的关键环节，因为AI代理在执行任务时可能需要读写文件、执行shell命令、访问网络等操作，不加限制的自动执行可能带来安全风险（如误删文件、执行危险命令）。Codex App的分级权限设计在安全性和效率之间取得了平衡。
语音输入：支持语音对话，识别精准度表现不错
归档管理：已完成的Street可以归档，需要时随时恢复继续对话

Git深度集成：以版本控制为核心的工作流

Codex App与Git的集成程度非常深，可以说Git是整个工具的骨架。所有的代码变更都通过Git记录来追踪和管理。

在代码回滚方面，Codex App的方式与其他AI编程工具有明显区别。它不是在对话中提供回滚按钮，而是基于Git的变更记录进行操作。每次对话产生的代码修改都会生成对应的Git记录，你可以对任意一条记录执行revert操作来回滚代码。这种基于Git原生能力的回滚方式比其他工具的"快照回滚"更加可靠和透明——每次revert本身也是一个Git commit，完整保留了操作历史，不会丢失任何信息，也便于团队协作时追溯变更原因。

提交代码时，Codex App提供三种方式：

直接Commit：仅在本地提交
Commit + Push：提交并推送到远程Git服务器
Commit + 创建PR：提交代码并自动创建Pull Request

创建PR时，AI会自动总结变更内容生成commit message，然后推送到Git服务器并创建合并请求。Pull Request是现代软件团队协作的核心流程，它不仅是代码合并的机制，更是代码审查、知识共享和质量把关的重要环节。一个高质量的PR通常需要包含清晰的变更描述、影响范围说明和测试情况。然而，编写PR描述是许多开发者觉得繁琐的工作，尤其是在快速迭代的敏捷开发中。Codex App通过AI自动总结代码变更生成PR描述，不仅节省了时间，还能确保描述的完整性和一致性，从代码生成到PR创建形成了完整的闭环。

此外，Codex App还支持Worktree功能。Git Worktree是Git 2.5版本引入的一项功能，允许开发者在同一个仓库中同时检出多个工作目录，每个工作目录对应不同的分支。传统Git工作流中，切换分支意味着整个工作目录的文件状态都会改变，如果有未提交的修改就需要先stash或commit。Worktree解决了这个问题——你可以在一个目录中开发feature-A分支，同时在另一个目录中修复bugfix-B分支，两者完全隔离互不干扰。在Codex App的上下文中，Worktree与Streets的并行开发理念完美契合：每个Street可以对应一个独立的Worktree，多个功能特性的开发在物理文件层面也实现了完全隔离，避免了代码冲突和状态污染。使用时项目必须在Git目录中，你可以选择从某个分支拉取一个Worktree来进行隔离开发，这对于多特性并行开发的场景尤其有价值。

技能系统：可复用的AI能力模块

技能（Skills）是Codex App中一个设计精良的功能模块。它提供了一个可视化的技能管理界面，能够展示全局技能和当前项目的技能，还会根据项目特征智能推荐适用的技能。

Codex App的技能系统本质上是对Prompt Engineering（提示词工程）的产品化封装。在底层实现上，每个"技能"实际上是一组结构化的提示词模板、工作流定义和上下文配置的组合。传统的提示词工程要求开发者手动编写和管理复杂的prompt，而技能系统将这一过程可视化和模块化——开发者可以像管理软件包一样安装、启用、禁用和分享技能。这种设计借鉴了软件工程中"关注点分离"的原则，将AI能力的定义与使用解耦，使得非提示词专家也能快速获得高质量的AI辅助能力。

技能管理

对已安装的技能，你可以进行启用、禁用或卸载操作。当多个技能存在冲突时，可以临时禁用某些技能，在切换项目时再重新启用。这种灵活的管理方式在实际开发中非常实用——例如，一个前端项目可能需要启用React组件生成技能，而切换到后端项目时则需要禁用它并启用API设计技能。

创建自定义技能

创建技能有两种触发方式：使用$符号调用Skill Creator命令，或者直接在对话中描述需求。例如，你可以创建一个"截图转网页"的技能——将截图进行图片分析，生成说明文档，再根据文档进行开发。这种多步骤工作流的封装能力，使得复杂的重复性任务可以被一键触发。

创建完成后需要重启Codex App才能生效。使用技能时同样有两种方式：通过$符号手动调用，或在对话中通过文字描述让AI自动匹配调用。

安装外部技能

Codex App支持三种技能安装途径：

通过Secure Install命令从OpenAI官方技能库安装
通过npx skills add命令安装社区技能，这是目前最通用的方式
手动创建自定义技能

npx skills add的优势在于它支持跨工具安装，可以通过软链接（symlink）映射到不同的AI编程工具中，解决了不同工具技能目录不统一的问题。这借鉴了Node.js生态的包管理理念——就像npm让JavaScript库可以在不同项目间共享一样，npx skills让AI技能可以在不同工具间共享。这意味着同一个技能可以同时在Codex App、Cursor、Claude Code等不同AI编程工具中使用，降低了生态锁定风险，也促进了AI编程社区的技能共享和协作。

自动化：定时触发的智能任务

Codex App的自动化功能可以说是最具创新性的特性之一。如果说Hooks（钩子）是在对话生命周期的特定节点触发操作，那么自动化则是基于时间维度的定时任务调度。

Hooks和自动化代表了两种不同的事件驱动模型：Hooks是"事件驱动"（Event-Driven），在特定动作发生时立即响应，例如在AI完成代码生成后自动运行lint检查；而自动化是"时间驱动"（Time-Driven），按照预设的时间间隔周期性执行任务。这两种模式在DevOps领域都有成熟的对应物——Git Hooks和Cron Jobs，Codex App将它们引入AI编程工具的上下文中，赋予了新的应用场景。

你可以设置一个时间间隔（如每天、每两小时），让AI定时执行特定的提示词任务。官方提供了两个典型应用场景：

场景一：自动学习技能。设置每隔两小时扫描项目的对话记录，从中提炼出可以总结为技能的内容，自动创建新技能。这相当于让AI在工作过程中不断自我学习和进化，持续丰富技能库。这一设计体现了"元学习"（Meta-Learning）的思想——AI不仅在执行任务，还在从执行过程中学习如何更好地执行未来的任务。

场景二：自动总结报告。定时对项目进展进行总结归档，生成开发日志或进度报告。这对于需要向项目经理或客户汇报进度的开发者来说尤其有价值，自动化消除了手动编写日报/周报的负担。

需要注意的是，自动化功能要求Codex App保持运行状态，关闭应用后定时任务将暂停。这个限制意味着它更适合作为日常开发时的后台智能助手，而非7×24小时运行的CI/CD系统。未来如果能与云端服务结合，实现离线状态下的任务执行，将大幅提升其实用价值。

相比Hooks在每个具体事件节点触发的细粒度控制，自动化提供了更宏观的时间维度管理能力，两者互为补充。

MCP支持与总结评价

在MCP方面，Codex App在设置中提供了MCP管理界面，推荐了少量官方MCP，同时支持通过自定义方式添加。MCP（Model Context Protocol，模型上下文协议）是Anthropic于2024年底推出的开放标准协议，旨在为AI模型提供统一的外部工具和数据源接入方式。在MCP出现之前，每个AI工具都需要为不同的外部服务（如数据库、API、文件系统）编写专门的集成代码，导致生态碎片化严重。MCP通过定义标准化的客户端-服务器通信协议，让AI应用可以像插件一样灵活接入各种外部能力。例如，通过MCP可以让Codex App直接查询Jira任务、读取Notion文档、操作数据库或调用内部微服务API，而无需为每个服务单独开发集成。目前MCP已获得OpenAI、Google等主要AI厂商的支持，正在成为AI工具生态的基础设施标准。可以将MCP类比为Web领域的HTTP协议——它定义了AI工具与外部世界通信的通用语言。Codex App目前的MCP功能相对基础，但满足了基本的扩展需求，随着MCP生态的成熟，预计未来会有更丰富的集成能力。

Codex App优点

操作流畅：整体使用体验丝滑，模型能力出色
界面简洁：风格类似OpenCode，去除了不必要的复杂性
开发者友好：基于Git和Streets的工作流非常适合以特性为单位的敏捷开发
交互轻量：不面向工程目录，而是面向具体任务和讨论
生态开放：通过npx技能共享和MCP协议支持，避免了工具锁定

当前不足

终端限制：每个对话只能打开一个终端命令行，当需要同时手动操作Git和运行本地服务时不太方便
文件预览缺失：查看任何文件都需要跳转到第三方编辑器（如Cursor），缺少内置的文件预览功能
平台支持有限：目前仅支持Mac，Windows和Linux版本尚在开发中
自动化依赖运行状态：定时任务需要应用保持打开，无法在后台持续运行

总体而言，Codex App代表了一种全新的AI编程工具理念——将开发者从"面向代码"解放到"面向需求"。虽然目前仍有一些使用体验上的粗糙之处，但其Streets并行开发、深度Git集成、技能系统和自动化任务等特性，展现了AI编程工具的一个值得关注的演进方向。它不是要取代传统IDE，而是在传统IDE之上构建了一个更高抽象层级的开发界面，让开发者可以在需求描述和代码实现之间自由切换。