Google Agent Platform全解析:ADK、MCP、A2A构建生产级AI Agent

Google发布Gemini Enterprise Agent Platform完整技术栈,展示生产级AI Agent开发全流程。
Google Cloud Next 2025上,Google展示了Gemini Enterprise Agent Platform的完整架构,涵盖ADK开发框架、无服务器运行时、Agent网关与注册中心、可观测性等核心组件。通过马拉松模拟规划演示,展示了从Agent构建、多Agent协作(A2A协议)、上下文工程(Session/Memory/RAG三层架构)、全链路调试到安全治理(Agent Identity与Gateway)的生产级闭环,标志着Agent开发从实验走向工业化。
Google Cloud Next 2025 开发者主题演讲中,Google 正式展示了 Gemini Enterprise Agent Platform 的完整技术栈,并通过一个「马拉松模拟规划」演示,从零到一展示了如何构建、部署、调试和治理生产级 AI Agent。这场演讲不仅是一次产品发布,更是对 2026 年 Agent 开发范式的一次全景式预演。
Agent Platform 架构全景
从开发到运维的完整闭环
Google 的 Agent Platform 提供了一套端到端的 Agent 开发和运维体系,核心组件包括:
- Agent Development Kit (ADK):Agent 开发框架,支持为 Agent 赋予技能(Skills)和工具(Tools)
- Scalable Serverless Agent Runtime:可扩展的无服务器运行时,支持会话(Sessions)管理和记忆(Memory)持久化
- Agent Gateway:Agent 网关,通过唯一的 Agent Identity 实施细粒度的安全策略
- Agent Registry:Agent 注册中心,类似于 Agent 世界的 DNS,支持 Agent 间的发现与协作
- Agent Observability:可观测性模块,提供运行指标监控和集成评估
值得关注的是,Google Cloud 的每个服务现在都默认支持 MCP(Model Context Protocol),Agent 可以无缝地与 Google Cloud 生态中的任何服务通信。
共享上下文的 Agent 生态
Google 正在自己的 Agent Platform 上构建应用,通过 Gemini Enterprise、Workspace 和第三方市场 Agent 之间的共享上下文,让整个 Agent 生态系统协同工作。企业不再需要为每个 Agent 单独构建数据管道,而是通过平台级的上下文共享实现真正的多 Agent 协作。
从零构建 Planner Agent:ADK 实战
Skills + Tools 的模块化设计
演示从一个马拉松路线规划 Agent 开始。开发者 Mofi Rahman 展示了如何通过 Agent Designer 快速原型设计,然后用代码逐步增强 Agent 能力。
Agent 的核心构建模块分为三个层次:
- Instructions:定义 Agent 的角色和行为准则
- Skills:由 YAML 元数据和 Markdown 正文组成的专业技能包,涵盖地图技能、GIS 技能和赛事总监技能
- Tools:通过 Google Cloud MCP Server 连接外部服务,如 Google Maps

Skills 的设计相当精巧——元数据中的描述让 Agent 知道何时加载技能的完整内容,实现了渐进式的上下文理解,有效减少了 Token 消耗和响应时间。团队还直接将现有的 Google Doc 流程文档通过 Gemini 转换为 Agent 可用的 Skill,大幅降低了知识工程的门槛。
远程 MCP Server 的威力
与本地 MCP Server 不同,Google Cloud 提供的是完全托管的远程 MCP 服务。开发者无需成为 Google Maps 专家,MCP for Google Maps 就能为 Agent 提供开箱即用的地图工具,同时 Google 负责处理安全需求和工具设计。这种「平台即能力」的理念,让 Agent 开发者可以专注于业务逻辑而非基础设施。
多 Agent 协作:A2A 协议与 Agent Registry
从单体到多 Agent 系统
单个 Planner Agent 显然不够。演示引入了三个协作 Agent:
- Planner Agent:规划马拉松路线
- Evaluator Sub-agent:使用独立模型和有限上下文评估路线质量
- Simulator Agent:执行模拟,生成数千名跑者的行为
Evaluator 的设计体现了一个重要原则:它使用独立的模型和有限的上下文来评判路线,只关注路线计划本身而非整个流程。评估标准同时覆盖非确定性指标(如社区影响)和确定性指标(如路线必须精确为 26 英里 385 码)。
A2A 协议如何实现 Agent 即插即用
Google 创建并捐赠给 Linux 基金会的 A2A(Agent-to-Agent)协议,通过 Agent Card 消除了连接 Agent 之间脆弱的 API 代码。每个 Agent 暴露一个 Agent Card 作为能力清单,其他 Agent 可以读取并决定是否协作。
Agent Registry 则是 Agent 网络的中央目录,当 Agent 部署到 Agent Runtime 时会自动注册。Planner 和 Simulator 之间的连接是零代码、零 API 契约的——真正实现了 Agent 的即插即用。
A2UI:Agent 动态生成用户界面
A2UI(Agent to User Interface)是 Google 创建的开放标准,让 Agent 能够动态生成表达性 UI,而不是输出大段文本。通过 one-shot 示例,Gemini 学会了如何生成界面组件,包括在地图上渲染路线和展示评估结果。这从根本上改变了 Agent 应用的用户体验范式。
上下文工程:从无状态到有状态 Agent
Session、Memory 与 RAG 的三层架构
上下文工程是 Agent 开发中最关键的环节之一。演示展示了三层上下文管理架构:
- Sessions:通过不到 20 行代码集成 Agent Platform Sessions,让 Agent 在多轮交互中保持状态
- Memory Bank:企业级全托管记忆服务,自动基于 Agent 使用模式创建记忆,支持长期记忆存储
- RAG with AlloyDB:通过 Document AI 语义分块、AlloyDB 自动嵌入和向量搜索,将非结构化数据(如拉斯维加斯的本地法规)引入 Agent 上下文

一个值得注意的细节:AlloyDB 的 auto-embeddings 功能可以根据指定模型自动生成嵌入向量,开发者无需手动处理。而通过语义搜索发现的「不能在公共道路上骑骆驼」的法规,则生动展示了 RAG 如何为 Agent 带来真实世界的领域知识。
Agent 可观测性与全链路调试
从告警到修复的完整调试流程
当演示中模拟器 Agent 崩溃时,Megan O'Keefe 展示了一套完整的调试流程:
- 告警触发:Gmail 中收到模拟器 Agent 高延迟告警
- Trace 分析:通过 Agent Runtime Trace View 查看底层工具调用和推理流程
- CloudAssist 调查:一键启动 Gemini CloudAssist 调查,自动收集日志并分析基础设施
- IDE 联动:在 Anti-Gravity IDE 中通过 MCP 继续 CloudAssist 调查
- 根因定位:发现 Event Compaction 配置不当导致超出 Gemini API 的 100 万 Token 上下文限制
- 代码修复:Agent 不仅找到根因,还建议添加 Token 阈值参数的代码修复方案
这个案例揭示了一个重要洞察:Agent 仍然是软件,安全运维需要透明的指标、正确的调试工具,以及对规模的关注——不仅是基础设施规模,还包括 Token 规模。
架构演进与 Vibe Clouding
用自然语言驱动基础设施变更
Bobby Allen 展示了一个引人注目的概念——"Vibe Clouding":用自然语言驱动基础设施变更。他通过一条提示词,让 Gemini CloudAssist 将 Cloud Run 服务转换为 GKE 部署,同时在同一集群中部署 Gemma 4 模型。

当扩展到数千名跑者时出现性能问题,CloudAssist 主动识别出存储瓶颈(GCS Fuse 不适合快速扩展场景),并推荐切换到 Lustre 存储。升级后的模拟器能够展示每个跑者的「思维气泡」——由集群中运行的 Gemma 4 模型实时生成。
这个演示传达的核心理念是:Agent 不应该只回答问题,而应该在你设定的护栏内与你合作采取行动。这就是 Google 所说的「自主云」愿景。
安全治理:Agent Identity 与 Agent Gateway
从 Service Account 到 Agent Identity
演示中暴露了一个安全问题:Planner Agent 不应该能修改预算数据。解决方案是 Agent Platform 的治理体系:
- Agent Identity:为每个 Agent 实例提供唯一且不可变的凭证,类似于每扇门的生物识别扫描器,而非共享的万能酒店钥匙
- Agent Gateway:作为 Agent 之间的代理,执行 IAM 策略
- Egress Policies:控制 Agent 对外部资源(工具、模型、其他 Agent)的出站访问

通过在 Agent Gateway 中为 Planner Agent 的 Finance MCP Server 添加 read-only 策略,几步操作就实现了基于角色的访问控制。
Wiz 安全扫描集成
Wiz 的集成展示了「Shift Down」(下移安全责任到平台层)的理念。Wiz 的 Red Agent 作为渗透测试者从外部探测漏洞,Green Agent 则建议根因修复方案。在演示中,Wiz 发现了一条从互联网到敏感数据的完整攻击路径,包含认证绕过漏洞,并提供了三个优先修复建议:降级 IAM 权限、修补认证漏洞、强制执行 AI 护栏。
开发者的关键启示
这场演讲传递了几个重要信号:
Agent 开发正在从实验走向生产。 Google 提供的不是玩具级工具,而是包含运行时、可观测性、安全治理的完整生产级平台。
MCP 正在成为 Agent 生态的通用语言。 Google Cloud 服务默认支持 MCP,意味着这个协议已经从概念验证进入了工业化阶段。
上下文工程取代 Prompt 工程成为核心挑战。 如何管理 Session、Memory 和外部数据源的协同,决定了 Agent 的实际表现。
演示中展示的所有代码都已开源,开发者可以直接克隆仓库复现整个马拉松模拟应用。Google 还提供了开发者解决方案指南和 Cloud Credits,降低了上手门槛。
在 Agent 时代,开发者的角色正在从「写代码的人」演变为「设计和治理 Agent 系统的人」。Google 的 Agent Platform 为这种转变提供了一个清晰的技术路线图——而这场演讲,就是这张路线图的最佳导览。
相关推荐
深度解读OpenClaw开源小龙虾AI Agent运作原理深度解析
深度解析OpenClaw(开源小龙虾)AI Agent的底层运作原理,涵盖System Prompt、工具调用、SubAgent分身、Skill系统、记忆机制与Context Engineering等核心概念,帮你彻底理解AI Agent与普通语言模型的本质区别。
深度解读Transformer本质解析:一个被拆解的文字接龙函数
用文字接龙的视角理解Transformer本质。将复杂的语言生成任务拆解为Embedding、Transformer Block、概率输出三大模块,帮助深度学习初学者快速建立直觉。
深度解读Claude Code与普通AI对话的五大核心差异
详细对比Claude Code与普通AI对话工具在交互方式、上下文理解、执行力、记忆能力和工具调用五个维度的核心差异,帮你理解AI编程助手的真正价值。