播客频道 | Gemini 3.1 Pro + Claude Opus 4.6：AI编程最强组合实战指南

今天聊一个特别有意思的事儿。我们都知道现在AI写代码已经不稀奇了，但你有没有想过，让两个AI模型组队干活，一个当架构师，一个当程序员，然后从零撸出一个Minecraft？哈哈，听起来像科幻对吧？但这事儿还真有人做出来了。而且用的工具组合特别巧妙——Anthropic的Claude Opus 4.6负责规划，Google的Gemini 3.1 Pro负责写代码。两个模型各干各的活，最后还真搞出了一个功能相当完整的Minecraft克隆版。等等，我先帮听众理清一下。为什么不直接用一个模型搞定所有事情？非得搞两个模型协同？这就是关键了。你可以这么理解——Claude Opus 4.6是那种特别会做顶层设计的人，它有百万级的上下文窗口，意味着它一次能读懂几十万行代码的上下文关系。做架构设计、梳理模块依赖、规划技术路线，它是一把好手。在SWE-bench这种从真实GitHub项目里抽出来的编程测试里，它的表现非常强。但问题是，它贵啊。贵到什么程度？ Gemini 3.1 Pro的成本大概只有Opus的七分之一到八分之一。而Gemini呢，它在前端开发、UI生成这些执行层面的活儿上特别出色，生成的界面还挺好看的。但它有个明显的短板——容易产生幻觉。就是说它可能会编造一些不存在的API，或者写出语法正确但逻辑完全跑偏的代码。嗯，这个我理解。AI幻觉本质上是因为大语言模型是概率预测系统嘛，它不是真的懂代码语义，而是在猜最可能的下一个词。对，所以解决思路就出来了——你让Opus先花时间做一份特别详尽的实施计划，把架构、目录结构、每个模块的功能规格都写清楚。然后把这份计划喂给Gemini，让它照着执行。这本质上是一种提示工程策略，用结构化的约束条件收窄Gemini的输出空间，让它不容易跑偏。有点像公司里架构师画好蓝图，开发工程师照着蓝图写代码。完全就是这个意思！而且这个类比特别准确。传统软件团队里有架构师、开发者、审查者三个角色，现在这三个角色全被不同特长的AI模型替代了。那具体怎么操作的？我知道他们用了Google的Anti-Gravity IDE。对，Anti-Gravity是Google出的AI原生IDE，跟传统的VS Code加Copilot不一样。它允许你在同一个界面里切换不同的AI模型，还分了规划模式和执行模式。第一步，你选思考模式，挂上Claude Opus 4.6，然后给它一个非常详细的需求描述——比如这个Minecraft项目，你得告诉它要什么技术栈、游戏循环要保证60帧、要有无限地形生成、区块生命周期管理、物品栏系统等等。 60帧意味着整个游戏循环得在大约16毫秒内跑完一轮，这对性能要求挺高的吧？非常高。尤其是体素游戏，每个可见区块可能有几千个面片要渲染，需要用贪心网格合并、视锥体剔除这些优化技术。AI在生成这类性能敏感的代码时特别容易出问题，所以更需要高质量的架构规划把性能约束提前考虑进去。Opus生成的那份计划据说质量非常惊艳，不光覆盖了所有需求，还主动考虑了扩展性。然后第二步就是切到Gemini了？对，切到Fast模式，选Gemini 3.1 Pro，然后告诉它：按照刚才Opus生成的实施计划来执行开发。Gemini就会自动按阶段生成代码——先搭项目结构和文件框架，再写游戏逻辑和程序化地形生成。这里面涉及到Perlin噪声算法来模拟自然地貌，区块的按需加载和卸载，还有确定性种子保证同一坐标永远生成同样的地形。整个过程中人需要干预吗？这是Anti-Gravity一个很好的设计——它支持Human-in-the-Loop，就是人工介入机制。你可以实时监视AI的生成过程，觉得没问题再批准。这在AI安全领域是被广泛推崇的做法，防止幻觉代码或安全漏洞被悄悄混进去。那最终做出来的东西到底怎么样？说实话，完成度相当高。生存模式、创造模式都有，3D世界可以自由探索，无限地形程序化生成，地下有洞穴系统还有各种矿石——包括钻石矿。地面上有花草树木，还有岩浆。生物系统也做了，羊啊鸡啊会自动生成，你可以跟它们交互。物品栏、方块放置、物品合成、生命条、跌落伤害、踩岩浆会死……基本上核心玩法都有了。这要是传统团队来做，得多久？一个功能这么全的体素游戏，传统团队少说几周，复杂点的几个月。AI协同工作流压缩到了几个小时级别。当然它不完美，比如海洋方块配置不够精细，有些树没叶子，但考虑到这是两个AI从零构建的，已经很惊人了。而且关键是，这套方法论不只是用来做游戏的对吧？完全可以推广。Web应用、移动端开发、后端服务，任何需要先做架构设计再落地执行的项目都适用。核心就一句话：让每个模型做它最擅长的事。Opus做规划和重构，Gemini做代码生成和快速迭代。你甚至可以在开发完成后让Opus回来做代码审查和优化，形成规划、执行、审查的三阶段循环。而且用Anti-Gravity的免费版就能跑通这套流程，虽然可能会碰到速率限制。对，免费版有额度限制，触发了就等几个小时或者换个备选模型顶一下。但核心思路是不变的——多模型编排，各司其职。我觉得随着更多AI模型出现和开发工具的成熟，这种编排式编程很可能会成为未来软件工程的主流。开发者的角色会从写代码变成设计AI工作流、审核AI输出。从对话式编程到编排式编程，开发者从码农变成了AI团队的项目经理。这个趋势确实值得所有做技术的人认真关注。好，今天这个话题就聊到这儿，核心就一个词——分工。AI模型之间的分工，可能比我们想象的要来得更快、更彻底。

Gemini 3.1 Pro + Claude Opus 4.6：AI编程最强组合实战指南

更多播客

AI热点风向标·06月07日午间版

AI热点风向标·06月07日早间版

每日AI新鲜事·06月07日早间播报