AI编程实战·本周专题:从工具到方法论,AI编程正在经历什么
AI编程实战·本周专题:从工具到方法论,AI编程正在经历什么
每周二聚焦AI辅助编程的最新工具和实战技巧
每周二聚焦AI辅助编程的最新工具和实战技巧
欢迎回来,今天咱们AI编程实战专栏,我攒了一周的素材,聊点硬核的。
行,我刚好这周也在折腾好几个AI编程工具,正想吐槽。
等会儿吐槽,先说个事——我发现你今天穿的这件卫衣,是不是上次团建那件?
得了吧,我衣柜里灰色卫衣有三件,你分不清的。赶紧聊正事。
好好好。这周我看了好几篇文章,有个特别明显的感受:AI编程这事儿,已经不是在讨论某个工具好不好用了,而是整个开发方式在变。
你这个观察非常准。我先抛个结论——2025年AI编程的关键词不是工具,是范式迁移。
范式迁移?展开说说?
你看,有篇文章专门讲了三个阶段:提示词工程、上下文工程、驾驭工程。这三步其实就是从问问题到管项目的进化。
对,那篇Harness Engineering的文章我也看了。说实话,提示词工程我太熟了,天天写prompt。但驾驭工程到底是什么,我一开始没太理解。
打个比方吧。提示词工程像你去餐厅点菜,上下文工程是你把菜谱、口味偏好、过敏信息全给服务员,而驾驭工程——你直接当了餐厅经理。
就是说你不再是使用者,而是在管理AI怎么干活。
没错。你要定义Skill体系、编码规范、任务拆解策略,AI变成你团队里的执行者。这跟传统的写代码完全是两回事。
这让我想到另一篇文章,用Cursor从零搭建个人博客那个。作者说了一句话我印象特别深——不是写代码,而是驾驭AI写代码。
对,那篇文章其实是驾驭工程的入门级实践。你看他的流程:先用Google Teach生成UI原型,再把链接喂给Cursor生成前后端代码。
整个过程几乎没手写代码,但每一步他都得知道在做什么。这对产品经理来说太友好了,我都想试试。
但你注意到没有,这里面有个很大的前提——你得能判断AI写的代码对不对。不懂技术的人用这套流程,踩坑概率极高。
这倒是。那我们聊聊模型层面的事。这周MiniMax M3和DeepSeek正面对决那篇你看了吧?
看了。说实话结果不意外,国产模型在代码生成上进步很快,但差异化还不够明显。
M3还是个多模态模型,能看截图生成代码,这个能力在前端开发场景下挺有想象空间的。
理论上是,但实测下来,纯代码生成能力才是硬指标。多模态是加分项,不是决定项。
那你觉得现在国产模型跟Claude Fable 5这种级别的差距有多大?
这么说吧,Karpathy亲自下场说Fable 5带来了质变体验。注意他用的词——不是量变,是质变。
他说跑分领先不是重点,定性层面的体验跃升才关键。这句话我反复看了好几遍。
这其实揭示了一个行业问题。大家都在卷benchmark,但用户真正感知到的是交互质量、纠错能力、对复杂需求的理解深度。
所以国产模型不能光追分数,得在实际开发场景里打磨体验。
完全同意。而且你注意到没有,现在工具端出现了一个有趣的趋势——解耦。
解耦?你是说像CC Switch那种中转站工具?
对。Codex是OpenAI的壳,但底层模型可以换成DeepSeek或者火山引擎。Cloud Code也是,一个插件接多个模型。工具和模型正在分离。
这对开发者来说太好了,不用被绑死在一个生态里。
但对模型厂商来说压力就大了。你的模型如果没有独特优势,随时会被替换掉。
说到这个,我从产品视角补充一点。现在AI编程工具的竞争已经不只是模型能力了,还有工作流的完整度。
你说的是从设计到部署的全链路?
对,你看那个博客项目,从UI原型到前后端代码到数据库配置,用了三四个工具串起来。谁能把这条链路做得最顺滑,谁就赢。
这也是为什么驾驭工程会成为趋势。单点工具再强,也需要一个方法论把它们串起来。
好,那我们来总结一下这周的几个核心观察。
第一,AI编程从代码补全进化到了自主执行的Agent模式,这是底层能力的跃迁。第二,工具和模型正在解耦,开发者有了更多选择权。
第三,驾驭工程作为新的方法论正在落地,核心能力从写代码变成了管理AI写代码。第四,模型竞争的关键不是跑分,而是实际开发中的体验质量。
最后留个思考题给听众——当AI能帮你完成百分之九十的编码工作时,剩下那百分之十到底是什么?想清楚这个问题,你就知道自己该学什么了。
这个问题太好了,我自己也在想。下期咱们可以专门聊聊这个话题,今天就到这儿,下期见。
相关推荐
科技前沿GitHub Agent HQ发布:AI编程工具进入平台化竞争时代
GitHub Universe大会发布Agent HQ平台,统一管理编码Agent,Copilot升级支持多模型集成。同期OpenAI完成重组,Anthropic新模型测试,NVIDIA开源系列AI模型,AI编程工具格局加速整合。
科技前沿Gemini 3.5 Flash在GDPval基准上实现巨大飞跃
Google Gemini 3.5 Flash在GDPval基准测试中超越Gemini 3.1 Pro,轻量级Flash模型借助后训练技术逼近前沿水平,重新定义性能与成本的平衡点,为AI应用开发者带来重大利好。
科技前沿Google Gemini Antigravity周配额三倍提升,AI编程不再受限
Google Gemini团队再次将Antigravity周配额提升至三倍,继日配额提升后再次加码。本文解析此次配额调整对开发者的实际影响,以及在AI编程助手竞争格局中的战略意义。