Google Anti-Gravity 2.0详解:替代Gemini CLI的多智能体开发平台

Google以Anti-Gravity 2.0全面替代Gemini CLI,推出Agent-First开发平台。
Google在I/O 2026上宣布终止Gemini CLI,以全新的Anti-Gravity 2.0平台取而代之。该平台采用Agent-First设计理念,支持多Agent并行协作,提供桌面应用、CLI终端和SDK三种产品形态,共享统一的底层Agent基础设施。配合速度提升4倍的Gemini 3.5 Flash模型和Managed Agents功能,标志着AI开发从单Agent工具迈向生产级多Agent生态系统。
Gemini CLI 正式退场,Anti-Gravity 2.0 全面接管
Google 在 Google I/O 2026 上完成了一次重大产品更替——Gemini CLI 被正式宣告终止。从 2026 年 5 月 19 日起,替代方案已经上线;到 2026 年 6 月 18 日,Gemini CLI 将彻底停止服务,Google AI Pro Ultra 和免费版用户都将受到影响。
这不是一次温和的版本迭代,而是一次彻底的产品替换。取而代之的是 Anti-Gravity 2.0——Google 全新的 Agent-First 开发平台。
所谓 Agent-First,是近两年 AI 工程领域兴起的核心设计哲学。传统软件开发以「工具调用」为中心——开发者明确指定每一步操作;而 Agent-First 范式则将「目标描述」交给 AI,由 Agent 自主规划执行路径、调用工具、处理异常。这一转变的技术基础是大语言模型推理能力(Chain-of-Thought)与工具调用能力(Function Calling/Tool Use)的成熟。从 OpenAI 的 Assistants API 到 Anthropic 的 Claude Agents,再到 Google 的 Anti-Gravity,各大厂商都在押注这一方向。其核心挑战在于:单 Agent 的上下文窗口和执行时间有限,复杂任务必须拆解为多 Agent 协作才能完成,这也是 Anti-Gravity 2.0 架构设计的根本出发点。
Gemini CLI 的设计理念属于上一个时代:一个 AI Agent 一次处理一个任务,按步骤顺序执行。但现实中的团队协作早已进化到需要多个 Agent 互相协作、并行处理大型任务的阶段。Gemini CLI 的架构根本无法支撑这种需求,所以 Google 选择了推倒重来。
Anti-Gravity 2.0 的三种产品形态
Anti-Gravity 2.0 并不是一个单一产品,而是一个完整的生态系统,主要以三种形式呈现:

桌面应用:多 Agent 并行的控制中心
全新的桌面应用专门为同时运行多个 Agent 而设计,支持后台自动处理任务,并且原生连接 Google AI Studio、Android 和 Firebase。这是一个真正的「指挥中心」,而不仅仅是一个代码编辑器。
CLI 终端版:Gemini CLI 的直接替代方案
Anti-Gravity CLI 是 Gemini CLI 的直接继任者,基于原生 Go 语言构建,运行速度显著提升。最关键的特性是支持持久化运行——启动一个大任务后,它会在后台持续执行,几个小时后回来查看,所有文件和状态都保持在你离开时的位置。
持久化运行(Persistent Execution)解决的是 AI Agent 的「无状态困境」。传统 API 调用是无状态的——每次请求独立,上下文需要客户端自行维护,长时间任务一旦中断便前功尽弃。持久化 Agent 则在服务端维护完整的执行状态,包括已完成的工具调用记录、文件系统变更、中间变量等,允许任务跨越数小时甚至数天运行。这在技术上依赖于检查点机制(Checkpointing)和事件溯源(Event Sourcing)架构。对于需要爬取大量数据、执行复杂代码或处理长文档的任务,持久化运行是从「玩具级」走向「生产级」的关键门槛。Anti-Gravity CLI 的持久化特性意味着开发者可以真正将 Agent 当作「后台服务」而非「交互式助手」来使用。
SDK:程序化访问底层 Agent 基础设施
Anti-Gravity SDK 提供对底层 Agent 基础设施的程序化访问接口,这套基础设施与 Google 自家内部产品使用的完全相同。企业版还可以直接接入 Google Cloud。
统一基础设施:Anti-Gravity 2.0 的核心竞争壁垒
这里是 Anti-Gravity 2.0 与市面上其他 AI 开发工具最本质的区别:桌面应用、CLI、SDK 都运行在同一个底层 Agent 系统上。

Google 将三种产品形态统一在同一套 Agent 基础设施上,这一架构决策背后有深刻的平台战略逻辑。在软件工程中,这被称为「单一真相来源」(Single Source of Truth)原则——避免多个代码库之间的功能漂移和维护成本。对用户而言,更重要的是可靠性的积累:Google 内部产品(如 Workspace、Search)使用同一套基础设施,意味着这套系统经过了超大规模的真实负载验证。这也是 Google 相比 Cursor、Windsurf 等专注 IDE 的竞争对手的结构性优势——后者的 Agent 能力依赖第三方 API,而 Google 的整个技术栈是垂直整合的。
Google 一旦升级核心 Agent 技术,整个生态里的每个产品都会自动获得更新。用户接入的不是某个复制品,而是 Google 内部使用的同一套基础设施。
对于 AI 公司来说,这意味着一种持续累积的优势:每次 Google 推出更智能的 Agent 更新,你的工作流水线也会自动变得更聪明,团队无需做任何额外工作。而那些使用分散、割裂工具的竞争对手,则需要手动更新并重新连接一切。
Gemini 3.5 Flash 模型:速度提升 4 倍
背后驱动这一切的模型是 Gemini 3.5 Flash,同样在 Google I/O 2026 上发布。这个模型在几乎所有 Benchmark 上都超越了 Gemini 3.1 Pro,而且速度比其他前沿模型快 4 倍。
大语言模型的推理速度由多个因素决定:模型参数量、推理架构(Dense vs MoE)、硬件加速(TPU/GPU)以及推理优化技术(量化、投机解码等)。Flash 系列模型是 Google 针对「速度-性能」权衡专门优化的产品线,通常采用混合专家架构(Mixture of Experts,MoE)——每次推理只激活部分参数,大幅降低计算量。值得注意的是,速度提升在 Agent 场景下的价值被进一步放大:多 Agent 并行工作流中,每个 Subagent 的延迟会影响整体任务完成时间,模型速度的提升对整个流水线的吞吐量有乘数效应。
4 倍速度在实际场景中意味着什么?假设团队现在花两小时制作一篇长内容,使用新模型后同样的内容只需不到 30 分钟。这不仅是省时间,更意味着内容产出从每周 2 篇跃升到每周 10 篇的可能性。
Managed Agents:一次 API 调用即可启动智能体
Google 在 Gemini API 中推出了 Managed Agents 功能。只需一次 API 调用,就能启动一个具备推理能力、工具使用能力的 Agent,它还能在自己隔离的 Linux 环境中执行代码。
![Managed Agents 应用场景](/media/screenshots/2941
相关推荐
科技前沿GitHub Agent HQ发布:AI编程工具进入平台化竞争时代
GitHub Universe大会发布Agent HQ平台,统一管理编码Agent,Copilot升级支持多模型集成。同期OpenAI完成重组,Anthropic新模型测试,NVIDIA开源系列AI模型,AI编程工具格局加速整合。
科技前沿Gemini 3.5 Flash在GDPval基准上实现巨大飞跃
Google Gemini 3.5 Flash在GDPval基准测试中超越Gemini 3.1 Pro,轻量级Flash模型借助后训练技术逼近前沿水平,重新定义性能与成本的平衡点,为AI应用开发者带来重大利好。
科技前沿Google Gemini Antigravity周配额三倍提升,AI编程不再受限
Google Gemini团队再次将Antigravity周配额提升至三倍,继日配额提升后再次加码。本文解析此次配额调整对开发者的实际影响,以及在AI编程助手竞争格局中的战略意义。