今天聊一个特别有意思的事儿。我们都知道现在AI写代码已经不稀奇了,但你有没有想过,让两个AI模型组队干活,一个当架构师,一个当程序员,然后从零撸出一个Minecraft?
哈哈,听起来像科幻对吧?但这事儿还真有人做出来了。而且用的工具组合特别巧妙——Anthropic的Claude Opus 4.6负责规划,Google的Gemini 3.1 Pro负责写代码。两个模型各干各的活,最后还真搞出了一个功能相当完整的Minecraft克隆版。
等等,我先帮听众理清一下。为什么不直接用一个模型搞定所有事情?非得搞两个模型协同?
这就是关键了。你可以这么理解——Claude Opus 4.6是那种特别会做顶层设计的人,它有百万级的上下文窗口,意味着它一次能读懂几十万行代码的上下文关系。做架构设计、梳理模块依赖、规划技术路线,它是一把好手。在SWE-bench这种从真实GitHub项目里抽出来的编程测试里,它的表现非常强。但问题是,它贵啊。
贵到什么程度?
Gemini 3.1 Pro的成本大概只有Opus的七分之一到八分之一。而Gemini呢,它在前端开发、UI生成这些执行层面的活儿上特别出色,生成的界面还挺好看的。但它有个明显的短板——容易产生幻觉。就是说它可能会编造一些不存在的API,或者写出语法正确但逻辑完全跑偏的代码。
嗯,这个我理解。AI幻觉本质上是因为大语言模型是概率预测系统嘛,它不是真的懂代码语义,而是在猜最可能的下一个词。
对,所以解决思路就出来了——你让Opus先花时间做一份特别详尽的实施计划,把架构、目录结构、每个模块的功能规格都写清楚。然后把这份计划喂给Gemini,让它照着执行。这本质上是一种提示工程策略,用结构化的约束条件收窄Gemini的输出空间,让它不容易跑偏。
有点像公司里架构师画好蓝图,开发工程师照着蓝图写代码。
完全就是这个意思!而且这个类比特别准确。传统软件团队里有架构师、开发者、审查者三个角色,现在这三个角色全被不同特长的AI模型替代了。
那具体怎么操作的?我知道他们用了Google的Anti-Gravity IDE。
对,Anti-Gravity是Google出的AI原生IDE,跟传统的VS Code加Copilot不一样。它允许你在同一个界面里切换不同的AI模型,还分了规划模式和执行模式。第一步,你选思考模式,挂上Claude Opus 4.6,然后给它一个非常详细的需求描述——比如这个Minecraft项目,你得告诉它要什么技术栈、游戏循环要保证60帧、要有无限地形生成、区块生命周期管理、物品栏系统等等。
60帧意味着整个游戏循环得在大约16毫秒内跑完一轮,这对性能要求挺高的吧?
非常高。尤其是体素游戏,每个可见区块可能有几千个面片要渲染,需要用贪心网格合并、视锥体剔除这些优化技术。AI在生成这类性能敏感的代码时特别容易出问题,所以更需要高质量的架构规划把性能约束提前考虑进去。Opus生成的那份计划据说质量非常惊艳,不光覆盖了所有需求,还主动考虑了扩展性。
然后第二步就是切到Gemini了?
对,切到Fast模式,选Gemini 3.1 Pro,然后告诉它:按照刚才Opus生成的实施计划来执行开发。Gemini就会自动按阶段生成代码——先搭项目结构和文件框架,再写游戏逻辑和程序化地形生成。这里面涉及到Perlin噪声算法来模拟自然地貌,区块的按需加载和卸载,还有确定性种子保证同一坐标永远生成同样的地形。
整个过程中人需要干预吗?
这是Anti-Gravity一个很好的设计——它支持Human-in-the-Loop,就是人工介入机制。你可以实时监视AI的生成过程,觉得没问题再批准。这在AI安全领域是被广泛推崇的做法,防止幻觉代码或安全漏洞被悄悄混进去。
那最终做出来的东西到底怎么样?
说实话,完成度相当高。生存模式、创造模式都有,3D世界可以自由探索,无限地形程序化生成,地下有洞穴系统还有各种矿石——包括钻石矿。地面上有花草树木,还有岩浆。生物系统也做了,羊啊鸡啊会自动生成,你可以跟它们交互。物品栏、方块放置、物品合成、生命条、跌落伤害、踩岩浆会死……基本上核心玩法都有了。
这要是传统团队来做,得多久?
一个功能这么全的体素游戏,传统团队少说几周,复杂点的几个月。AI协同工作流压缩到了几个小时级别。当然它不完美,比如海洋方块配置不够精细,有些树没叶子,但考虑到这是两个AI从零构建的,已经很惊人了。
而且关键是,这套方法论不只是用来做游戏的对吧?
完全可以推广。Web应用、移动端开发、后端服务,任何需要先做架构设计再落地执行的项目都适用。核心就一句话:让每个模型做它最擅长的事。Opus做规划和重构,Gemini做代码生成和快速迭代。你甚至可以在开发完成后让Opus回来做代码审查和优化,形成规划、执行、审查的三阶段循环。
而且用Anti-Gravity的免费版就能跑通这套流程,虽然可能会碰到速率限制。
对,免费版有额度限制,触发了就等几个小时或者换个备选模型顶一下。但核心思路是不变的——多模型编排,各司其职。我觉得随着更多AI模型出现和开发工具的成熟,这种编排式编程很可能会成为未来软件工程的主流。开发者的角色会从写代码变成设计AI工作流、审核AI输出。
从对话式编程到编排式编程,开发者从码农变成了AI团队的项目经理。这个趋势确实值得所有做技术的人认真关注。好,今天这个话题就聊到这儿,核心就一个词——分工。AI模型之间的分工,可能比我们想象的要来得更快、更彻底。