AI编程实战·本周专题:从工具到方法论,AI编程正在经历什么
AI编程实战·本周专题:从工具到方法论,AI编程正在经历什么
每周二聚焦AI辅助编程的最新工具和实战技巧
每周二聚焦AI辅助编程的最新工具和实战技巧
欢迎回来,今天咱们AI编程实战专栏要好好聊一期。我这周翻了一堆素材,发现一个特别有意思的趋势。
什么趋势?你先说说,我看看跟我的判断一不一样。
就是AI编程这件事,已经不是在讨论某个工具好不好用了,而是整个开发方式在变。从Codex接国产模型、到Cursor搭博客、再到驾驭工程这套方法论,感觉量变到质变了。
你这个观察挺准的。我先抛个结论——2025年AI编程的核心矛盾,已经从"模型够不够聪明"变成了"人会不会用"。工具层面其实已经够卷了。
对,先说工具这一层。这周有个实战案例特别典型,用OpenAI Codex接国产模型,通过一个叫CC Switch的中转工具,把请求转发到DeepSeek或者火山引擎。
CC Switch本质上就是个本地反向代理。技术上不复杂,但它解决了一个很现实的问题——国内开发者用不了GPT-5.5,那就换个后端嘛。
而且这个思路挺有代表性的。你看现在不管是Codex、Cursor还是Cloud Code,前端工具和后端模型已经解耦了。开发者可以自由切换模型。
这就是我说的"工具层已经够卷了"。你想想,MiniMax M3刚出来就被人拉去跟DeepSeek正面对决,用同样的任务——写个HTML游戏、搭个后台管理系统——直接横评。
对,那个测试我看了。你觉得M3表现怎么样?
M3有个有意思的点,它是多模态模型,理论上能看设计稿写代码。但纯编程能力上,跟DeepSeek比还是各有胜负,没有碾压级差距。
所以你的意思是,国产模型在编程能力上已经进入了一个"够用但没有谁能一骑绝尘"的阶段?
国产这边确实是这样。但国际上不一样,Claude Fable 5出来之后,Karpathy亲自下场说这是质变。
等等,我对Karpathy那段评价印象特别深。他说真正让他兴奋的不是跑分,而是定性层面的体验跃升。这个"定性"到底指什么?
简单说就是——以前AI写代码你得盯着它改,现在它自己能把活干完还知道回头检查。从"辅助补全"到"自主执行",这个跃迁是真实发生的。
这让我想到那个Cursor搭博客的案例。整个流程是先用Google Teach生成UI原型,再把链接丢给Cursor,AI直接生成前后端代码。几乎不手写代码。
你注意到没有,那篇文章有句话特别精准——"不是写代码,而是驾驭AI写代码"。
这就引出了驾驭工程这个概念。说实话我第一次听到Harness Engineering的时候,觉得又是一个造词运动。
得了吧,你这产品经理不也天天造词嘛。但驾驭工程确实不只是概念,它把AI编程的演进讲得很清楚——三个阶段。
提示词工程、上下文工程、驾驭工程。对吧?
对。第一阶段你跟AI一问一答,第二阶段你给它喂上下文和规范,第三阶段你构建一整套Skill体系,让AI在工程约束下自主干活。
我从产品视角翻译一下——第一阶段是用户手动操作,第二阶段是给AI发需求文档,第三阶段是给AI发工作流程SOP。
这个类比可以。而且你注意,这三个阶段跟模型能力的演进是对应的。上下文窗口从4K扩到200K,Agent能力从零到能自主debug,方法论才跟着升级。
所以工具在变、模型在变、方法论也在变。那对普通开发者来说,最该关注哪一层?
方法论。工具会趋同,模型会追平,但你怎么组织上下文、怎么拆解任务、怎么验收AI的产出——这些能力差距会越来越大。
这我同意。那个Cursor搭博客的案例里,虽然AI生成了大部分代码,但调试数据库配置、处理部署问题,还是得人来判断。
对,Karpathy也提到了一个概念叫杰文斯悖论——AI让编程效率提高了,结果人们写的代码反而更多了,因为以前不敢想的项目现在敢做了。
这不就是我们产品经理的噩梦嘛!开发效率提高了,需求只会更多。
你可拉倒吧,你们产品经理的需求本来就没少过。
好,拉回来。我觉得这周素材给我最大的感受是,AI编程已经从"能不能用"进入"怎么用好"的阶段。工具选型不是核心壁垒,工程化思维才是。
总结得不错。我再补一点——国产模型和国际模型的差距在缩小,但在Agent自主性这个维度上,Claude系列确实领先一个身位。这个差距值得持续关注。
那给听众留个思考题吧。如果你现在要从零开始一个个人项目,你会选择哪套工具组合、用什么方法论来驾驭AI?
欢迎大家在评论区分享你的方案。下期我们可以挑几个有意思的来聊聊。
好,本期AI编程实战专栏就到这里,我们下期见。
相关推荐
科技前沿GitHub Agent HQ发布:AI编程工具进入平台化竞争时代
GitHub Universe大会发布Agent HQ平台,统一管理编码Agent,Copilot升级支持多模型集成。同期OpenAI完成重组,Anthropic新模型测试,NVIDIA开源系列AI模型,AI编程工具格局加速整合。
科技前沿Gemini 3.5 Flash在GDPval基准上实现巨大飞跃
Google Gemini 3.5 Flash在GDPval基准测试中超越Gemini 3.1 Pro,轻量级Flash模型借助后训练技术逼近前沿水平,重新定义性能与成本的平衡点,为AI应用开发者带来重大利好。
科技前沿Google Gemini Antigravity周配额三倍提升,AI编程不再受限
Google Gemini团队再次将Antigravity周配额提升至三倍,继日配额提升后再次加码。本文解析此次配额调整对开发者的实际影响,以及在AI编程助手竞争格局中的战略意义。