Codex+Claude Code实战:从Vibe Coding到企业级AI工程化开发

AI编程工具的实战价值:不止于玩具级Demo
在AI编程工具百花齐放的今天,Codex和Claude Code无疑是全球AI编程能力最强的两个工具。但很多开发者面临一个共同困惑:用Vibe Coding(氛围编程)做出来的项目,为什么总是停留在玩具级别? 如何才能真正用AI工具开发出企业级项目?
B站UP主诸葛老师通过一场近3小时的实战直播,从零开始演示了两个项目的完整开发过程——电商项目和AI模型聚合平台,并深入讲解了从Vibe Coding到AI工程化编程的进阶路径。本文将梳理其中的核心要点和实战方法论。
Vibe Coding的能力边界:能做什么,不能做什么
Vibe Coding(氛围编程)这个概念源自国外,由特斯拉前AI总监、OpenAI联合创始人Andrej Karpathy在2025年初提出。他描述了一种全新的编程方式:开发者完全沉浸在"氛围"中,拥抱指数级增长的代码复杂性,忘记代码的具体存在,只通过自然语言描述意图。其核心思想很简单:你只需要把脑海中的需求写清楚,告诉AI编程工具,它就能帮你生成代码。 无论你是产品经理还是非技术人员,都可以快速搭建一个Demo。这一概念迅速在全球开发者社区引发热议,因为它代表了一种从"编写代码"到"描述意图"的根本性转变。

然而,正如任何新范式的早期阶段,Vibe Coding存在明显的天花板:
- 代码质量堪忧:生成的代码往往是"死伤代码",难以维护
- Bug修复困难:非技术人员无法有效指挥AI工具修复复杂Bug,容易陷入死循环
- 无法应对复杂业务:高并发、分布式、微服务架构等企业级需求完全无法胜任
诸葛老师举了一个很有说服力的例子:早期很多AI博主声称用Vibe Coding"干掉了程序员",但仔细看他们做的项目——不过是一个跨境电商小网站、一个番茄钟、一个补光灯工具,功能极其简单。真正的企业级项目,业务复杂度和技术复杂度远非Vibe Coding所能驾驭。
三种AI编程开发模式的递进路径
本次实战课程设计了三种递进式的开发模式,每个项目都会经历这三个阶段:
Vibe Coding快速原型
最基础的方式,适合快速验证想法。几分钟内就能搭建一个电商项目的基本框架,但仅限于Demo级别。这是小白入门AI编程的起点。
Plan模式:计划先行再编码
Codex和Claude Code都内置了Plan模式。在这种模式下,AI不会直接动手写代码,而是先制定开发计划,再按计划逐步实现。相比纯Vibe Coding,项目的结构性和可维护性有明显提升。Plan模式的核心价值在于引入了"分治思想"——将复杂需求拆解为可管理的子任务,每个子任务独立实现并验证,最终组合成完整系统。这种方式虽然比纯Vibe Coding多了一步规划环节,但显著降低了后期返工的概率。
SuperPAL工程化编程:企业级开发的正确姿势
这是真正的企业级开发方式。SuperPAL是Claude Code的一个插件,内置了一系列开发Skill(技能),覆盖了从需求分析、架构设计、编码开发到测试部署的全流程。

SuperPAL本质上是一套AI工程化编程的Agent Skill体系,类似于早期的Spy Code、Spy Kit等基于SDD(规范驱动开发)的工具,但更加成熟和完整。目前很多中小型公司已经在实际使用这套流程。
SDD(Specification-Driven Development,规范驱动开发)是一种软件工程方法论,强调在编码之前先建立完整的规范文档,包括接口定义、数据模型、行为约束等。在AI编程语境下,SDD的核心价值在于为AI Agent提供明确的"行为边界"——AI不再是自由发挥式地生成代码,而是在严格的规范约束下进行开发。这与传统的TDD(测试驱动开发)和BDD(行为驱动开发)形成互补关系。SuperPAL正是将SDD理念产品化,通过预定义的开发规范来约束AI的代码生成行为,从而提高输出质量的一致性和可预测性。
开发环境与工具链配置详解
核心工具选择
诸葛老师推荐的开发环境是 VS Code + Claude Code插件 + Codex桌面端/CLI。他特别指出,传统IDE如IntelliJ在AI时代已经显得落伍:
"如果IntelliJ不做大的变革,再过两三年被淘汰也不远了。Eclipse当年被IntelliJ干掉,现在IntelliJ又面临被AI编程工具干掉的局面。"
传统IDE的核心价值在于代码编辑、调试、重构等以"人工编写代码"为中心的功能。然而在AI编程时代,开发者的核心工作正从"写代码"转向"描述意图和审查代码",这使得轻量级编辑器(如VS Code)配合AI插件的组合反而比重量级IDE更具优势。JetBrains(IntelliJ母公司)虽然也在积极集成AI功能(如AI Assistant),但其架构设计的历史包袱使其难以像VS Code那样灵活地适配各种AI编程工具的工作流。Cursor、Windsurf等AI-native编辑器的崛起进一步加速了这一趋势,预示着开发工具领域正在经历一次根本性的代际更替。

实战中会用到的工具形态包括:
- Codex桌面端:可视化操作,适合日常开发
- Codex CLI(命令行):企业中使用较多的方式
- Claude Code CLI:命令行方式开发,配合SuperPAL插件效果最佳
后端大模型的选择策略
AI编程工具的核心竞争力,排第一位的永远是后端模型。诸葛老师分享了他对国内主流大模型的实测体验:

- 第一梯队:智谱GLM——综合能力最强,"股价涨到天上去了,公司成立没几年就快赶上小米"
- 性价比之选:DeepSeek——能力不错且价格极低
- 第二梯队:Minimax、Kimi、小米Mimo、阿里通义、腾讯混元
由于Claude(Anthropic)的CEO对中国用户不友好,频繁封号,诸葛老师选择在Claude Code中接入GLM作为后端模型,而Codex则使用GPT最新版本。值得注意的是,AI编程工具的效果高度依赖后端模型的代码生成能力,而代码生成能力又与模型的训练数据质量、上下文窗口长度、指令遵循能力等多个维度密切相关。选择合适的后端模型,本质上是在能力、成本、稳定性和合规性之间寻找最优平衡点。
OpenRouter解析:AI模型聚合平台的商业逻辑
课程的第二个实战项目是开发一个类似OpenRouter的AI模型聚合平台。OpenRouter是全球最大的AI大模型聚合平台,集成了市面上几乎所有主流大模型,包含免费和付费选项,并提供详细的模型评测排名。
OpenRouter的商业模式本质上是AI领域的"API网关聚合",类似于云计算早期的CDN聚合服务商。开发者只需对接OpenRouter一个API端点,即可访问OpenAI、Anthropic、Google、Meta等数十家模型提供商的数百个模型。其盈利模式包括:在模型提供商原价基础上加收10-20%的服务费、提供企业级SLA保障的增值服务、以及通过流量规模获取的批发折扣差价。这种模式的核心壁垒不在技术,而在于生态位——一旦大量开发者和应用依赖其统一接口,迁移成本就会形成天然护城河。
诸葛老师揭示了一个很多人忽略的商业事实:当前AI领域最赚钱的不是面向C端的AI应用(如豆包、腾讯元宝等都在亏钱),而是三个方向:
- 卖算力:芯片、半导体、内存等硬件,A股相关板块已经涨到天上
- 卖Token:智谱、腾讯等大厂的API服务
- 模型聚合平台:即"套壳卖Token"的网站
"我身边有朋友,就做这种套壳网站,团队十几个人,一年卖一两个亿。几年前跟我们还是一个数量级,现在已经在天上了。"
这类平台的商业模式很简单:拿到较便宜的Token批发价,通过聚合多家模型的方式零售给开发者,赚取差价。虽然技术门槛不高,但市场需求巨大。从技术实现角度看,这类平台的核心挑战在于:统一不同模型提供商的API格式差异、实现智能路由和负载均衡、处理各家模型的计费差异、以及保障服务的高可用性。这恰好是一个适合用AI工程化编程方式来开发的中等复杂度项目。
大厂AI工程化编程的内部实践
课程还涉及了国内头部互联网公司(如阿里)内部的AI工程化编程最佳实践。诸葛老师提到,各大厂内部正在推行一套基于Harness的AI工程化编程体系,核心理念是自闭环进化——从需求到代码到测试到部署,形成完整的AI辅助开发闭环。
Harness在AI工程化编程语境中指的是一套完整的"测试与执行框架",源自软件测试领域的Test Harness概念。在AI编程工具中,Harness体系负责构建一个自动化的反馈闭环:AI生成代码后,Harness自动执行编译检查、单元测试、集成测试,并将结果反馈给AI进行迭代修正。这种"生成-验证-修正"的自闭环机制大幅减少了人工介入的频率,是AI编程工具从"代码补全"进化到"自主开发"的关键技术基础。
Claude Code之所以被专业程序员广泛使用,正是因为其内部实现了一整套Harness工程体系,对专业化编程做了大量优化。具体而言,Claude Code在执行编码任务时,会自动运行项目的测试套件来验证生成代码的正确性,如果测试失败则自动分析错误原因并修正代码,直到所有测试通过。这种机制使得AI生成的代码质量远高于简单的一次性生成。有兴趣的开发者可以阅读Claude Code的源码,深入理解其工程化设计思想。
总结:AI编程进阶的三条路径
AI编程正在经历从"氛围编程"到"工程化编程"的范式转变。对于不同阶段的开发者,建议采取不同策略:
- 入门者:先用Vibe Coding快速体验,理解AI编程的基本流程
- 进阶者:掌握Plan模式,学会拆解需求、分步实现
- 专业开发者:深入学习SuperPAL等工程化编程框架,将AI工具融入企业级开发流程
无论选择哪条路径,核心原则不变:AI是工具,工程化思维才是核心竞争力。 正如软件工程从瀑布模型到敏捷开发的演进一样,AI编程也在经历从"随意生成"到"规范化工程"的成熟过程。掌握这一趋势的开发者,将在未来的技术竞争中占据显著优势。
相关推荐

OpenAI Codex CLI完全指南:从安装配置到企业级实战
深度解析OpenAI Codex CLI开源AI编程代理,涵盖安装配置、agents.md架构设计、多智能体协同、MCP协议对接及RAG智能客服实战项目,助你掌握终端AI编程工具的工程化用法。

谷歌AI控制路线图解读:假设AI失控后的防御框架
谷歌发布AI控制路线图,提出全新安全范式:假设AI对齐可能失败,在系统架构层面建立防线。本文深度解读这一框架的核心理念、关键要素及其对AI行业安全标准的深远影响。

智能体工厂:语音驱动AI编程,免费构建应用实战指南
智能体工厂(Agent Factory)将Claude Code封装为语音驱动的AI编程工具,支持数十种免费模型,通过对话即可实时生成网站、游戏、工具等应用。本文详解其核心功能、技术架构与上手体验。