AI编程实战·本周专题：从工具到方法论，AI编程正在经历什么

欢迎回来，今天咱们AI编程实战专栏要好好聊一期。我这周翻了一堆素材，发现一个特别有意思的趋势。

什么趋势？你先说说，我看看跟我的判断一不一样。

就是AI编程这件事，已经不是在讨论某个工具好不好用了，而是整个开发方式在变。从Codex接国产模型、到Cursor搭博客、再到驾驭工程这套方法论，感觉量变到质变了。

你这个观察挺准的。我先抛个结论——2025年AI编程的核心矛盾，已经从"模型够不够聪明"变成了"人会不会用"。工具层面其实已经够卷了。

对，先说工具这一层。这周有个实战案例特别典型，用OpenAI Codex接国产模型，通过一个叫CC Switch的中转工具，把请求转发到DeepSeek或者火山引擎。

CC Switch本质上就是个本地反向代理。技术上不复杂，但它解决了一个很现实的问题——国内开发者用不了GPT-5.5，那就换个后端嘛。

而且这个思路挺有代表性的。你看现在不管是Codex、Cursor还是Cloud Code，前端工具和后端模型已经解耦了。开发者可以自由切换模型。

这就是我说的"工具层已经够卷了"。你想想，MiniMax M3刚出来就被人拉去跟DeepSeek正面对决，用同样的任务——写个HTML游戏、搭个后台管理系统——直接横评。

对，那个测试我看了。你觉得M3表现怎么样？

M3有个有意思的点，它是多模态模型，理论上能看设计稿写代码。但纯编程能力上，跟DeepSeek比还是各有胜负，没有碾压级差距。

所以你的意思是，国产模型在编程能力上已经进入了一个"够用但没有谁能一骑绝尘"的阶段？

国产这边确实是这样。但国际上不一样，Claude Fable 5出来之后，Karpathy亲自下场说这是质变。

等等，我对Karpathy那段评价印象特别深。他说真正让他兴奋的不是跑分，而是定性层面的体验跃升。这个"定性"到底指什么？

简单说就是——以前AI写代码你得盯着它改，现在它自己能把活干完还知道回头检查。从"辅助补全"到"自主执行"，这个跃迁是真实发生的。

这让我想到那个Cursor搭博客的案例。整个流程是先用Google Teach生成UI原型，再把链接丢给Cursor，AI直接生成前后端代码。几乎不手写代码。

你注意到没有，那篇文章有句话特别精准——"不是写代码，而是驾驭AI写代码"。

这就引出了驾驭工程这个概念。说实话我第一次听到Harness Engineering的时候，觉得又是一个造词运动。

得了吧，你这产品经理不也天天造词嘛。但驾驭工程确实不只是概念，它把AI编程的演进讲得很清楚——三个阶段。

提示词工程、上下文工程、驾驭工程。对吧？

对。第一阶段你跟AI一问一答，第二阶段你给它喂上下文和规范，第三阶段你构建一整套Skill体系，让AI在工程约束下自主干活。

我从产品视角翻译一下——第一阶段是用户手动操作，第二阶段是给AI发需求文档，第三阶段是给AI发工作流程SOP。

这个类比可以。而且你注意，这三个阶段跟模型能力的演进是对应的。上下文窗口从4K扩到200K，Agent能力从零到能自主debug，方法论才跟着升级。

所以工具在变、模型在变、方法论也在变。那对普通开发者来说，最该关注哪一层？

方法论。工具会趋同，模型会追平，但你怎么组织上下文、怎么拆解任务、怎么验收AI的产出——这些能力差距会越来越大。

这我同意。那个Cursor搭博客的案例里，虽然AI生成了大部分代码，但调试数据库配置、处理部署问题，还是得人来判断。

对，Karpathy也提到了一个概念叫杰文斯悖论——AI让编程效率提高了，结果人们写的代码反而更多了，因为以前不敢想的项目现在敢做了。

这不就是我们产品经理的噩梦嘛！开发效率提高了，需求只会更多。

你可拉倒吧，你们产品经理的需求本来就没少过。

好，拉回来。我觉得这周素材给我最大的感受是，AI编程已经从"能不能用"进入"怎么用好"的阶段。工具选型不是核心壁垒，工程化思维才是。

总结得不错。我再补一点——国产模型和国际模型的差距在缩小，但在Agent自主性这个维度上，Claude系列确实领先一个身位。这个差距值得持续关注。

那给听众留个思考题吧。如果你现在要从零开始一个个人项目，你会选择哪套工具组合、用什么方法论来驾驭AI？

欢迎大家在评论区分享你的方案。下期我们可以挑几个有意思的来聊聊。

好，本期AI编程实战专栏就到这里，我们下期见。

相关推荐