Google Anti-Gravity 2.0详解：替代Gemini CLI的多智能体开发平台

Gemini CLI 正式退场，Anti-Gravity 2.0 全面接管

Google 在 Google I/O 2026 上完成了一次重大产品更替——Gemini CLI 被正式宣告终止。从 2026 年 5 月 19 日起，替代方案已经上线；到 2026 年 6 月 18 日，Gemini CLI 将彻底停止服务，Google AI Pro Ultra 和免费版用户都将受到影响。

这不是一次温和的版本迭代，而是一次彻底的产品替换。取而代之的是 Anti-Gravity 2.0——Google 全新的 Agent-First 开发平台。

所谓 Agent-First，是近两年 AI 工程领域兴起的核心设计哲学。传统软件开发以「工具调用」为中心——开发者明确指定每一步操作；而 Agent-First 范式则将「目标描述」交给 AI，由 Agent 自主规划执行路径、调用工具、处理异常。这一转变的技术基础是大语言模型推理能力（Chain-of-Thought）与工具调用能力（Function Calling/Tool Use）的成熟。从 OpenAI 的 Assistants API 到 Anthropic 的 Claude Agents，再到 Google 的 Anti-Gravity，各大厂商都在押注这一方向。其核心挑战在于：单 Agent 的上下文窗口和执行时间有限，复杂任务必须拆解为多 Agent 协作才能完成，这也是 Anti-Gravity 2.0 架构设计的根本出发点。

Gemini CLI 的设计理念属于上一个时代：一个 AI Agent 一次处理一个任务，按步骤顺序执行。但现实中的团队协作早已进化到需要多个 Agent 互相协作、并行处理大型任务的阶段。Gemini CLI 的架构根本无法支撑这种需求，所以 Google 选择了推倒重来。

Anti-Gravity 2.0 的三种产品形态

Anti-Gravity 2.0 并不是一个单一产品，而是一个完整的生态系统，主要以三种形式呈现：

Anti-Gravity 平台架构

桌面应用：多 Agent 并行的控制中心

全新的桌面应用专门为同时运行多个 Agent 而设计，支持后台自动处理任务，并且原生连接 Google AI Studio、Android 和 Firebase。这是一个真正的「指挥中心」，而不仅仅是一个代码编辑器。

CLI 终端版：Gemini CLI 的直接替代方案

Anti-Gravity CLI 是 Gemini CLI 的直接继任者，基于原生 Go 语言构建，运行速度显著提升。最关键的特性是支持持久化运行——启动一个大任务后，它会在后台持续执行，几个小时后回来查看，所有文件和状态都保持在你离开时的位置。

持久化运行（Persistent Execution）解决的是 AI Agent 的「无状态困境」。传统 API 调用是无状态的——每次请求独立，上下文需要客户端自行维护，长时间任务一旦中断便前功尽弃。持久化 Agent 则在服务端维护完整的执行状态，包括已完成的工具调用记录、文件系统变更、中间变量等，允许任务跨越数小时甚至数天运行。这在技术上依赖于检查点机制（Checkpointing）和事件溯源（Event Sourcing）架构。对于需要爬取大量数据、执行复杂代码或处理长文档的任务，持久化运行是从「玩具级」走向「生产级」的关键门槛。Anti-Gravity CLI 的持久化特性意味着开发者可以真正将 Agent 当作「后台服务」而非「交互式助手」来使用。

SDK：程序化访问底层 Agent 基础设施

Anti-Gravity SDK 提供对底层 Agent 基础设施的程序化访问接口，这套基础设施与 Google 自家内部产品使用的完全相同。企业版还可以直接接入 Google Cloud。

统一基础设施：Anti-Gravity 2.0 的核心竞争壁垒

这里是 Anti-Gravity 2.0 与市面上其他 AI 开发工具最本质的区别：桌面应用、CLI、SDK 都运行在同一个底层 Agent 系统上。

统一基础设施架构

Google 将三种产品形态统一在同一套 Agent 基础设施上，这一架构决策背后有深刻的平台战略逻辑。在软件工程中，这被称为「单一真相来源」（Single Source of Truth）原则——避免多个代码库之间的功能漂移和维护成本。对用户而言，更重要的是可靠性的积累：Google 内部产品（如 Workspace、Search）使用同一套基础设施，意味着这套系统经过了超大规模的真实负载验证。这也是 Google 相比 Cursor、Windsurf 等专注 IDE 的竞争对手的结构性优势——后者的 Agent 能力依赖第三方 API，而 Google 的整个技术栈是垂直整合的。

Google 一旦升级核心 Agent 技术，整个生态里的每个产品都会自动获得更新。用户接入的不是某个复制品，而是 Google 内部使用的同一套基础设施。

对于 AI 公司来说，这意味着一种持续累积的优势：每次 Google 推出更智能的 Agent 更新，你的工作流水线也会自动变得更聪明，团队无需做任何额外工作。而那些使用分散、割裂工具的竞争对手，则需要手动更新并重新连接一切。

Gemini 3.5 Flash 模型：速度提升 4 倍

背后驱动这一切的模型是 Gemini 3.5 Flash，同样在 Google I/O 2026 上发布。这个模型在几乎所有 Benchmark 上都超越了 Gemini 3.1 Pro，而且速度比其他前沿模型快 4 倍。

大语言模型的推理速度由多个因素决定：模型参数量、推理架构（Dense vs MoE）、硬件加速（TPU/GPU）以及推理优化技术（量化、投机解码等）。Flash 系列模型是 Google 针对「速度-性能」权衡专门优化的产品线，通常采用混合专家架构（Mixture of Experts，MoE）——每次推理只激活部分参数，大幅降低计算量。值得注意的是，速度提升在 Agent 场景下的价值被进一步放大：多 Agent 并行工作流中，每个 Subagent 的延迟会影响整体任务完成时间，模型速度的提升对整个流水线的吞吐量有乘数效应。

4 倍速度在实际场景中意味着什么？假设团队现在花两小时制作一篇长内容，使用新模型后同样的内容只需不到 30 分钟。这不仅是省时间，更意味着内容产出从每周 2 篇跃升到每周 10 篇的可能性。

Managed Agents：一次 API 调用即可启动智能体

Google 在 Gemini API 中推出了 Managed Agents 功能。只需一次 API 调用，就能启动一个具备推理能力、工具使用能力的 Agent，它还能在自己隔离的 Linux 环境中执行代码。

![Managed Agents 应用场景](/media/screenshots/2941