Gemini CLI保姆级教程：MCP扩展与记忆文件实战指南

Google 最新发布的 Gemini CLI 正式加入 AI 编程工具大战，直接对标 Anthropic 的 Claude Code 和 OpenAI 的 Codex CLI。凭借 100 万 Token 的超长上下文窗口、MCP Server 扩展支持以及项目记忆文件功能，Gemini CLI 为开发者提供了一套功能完备的命令行 AI 编程方案。本文将从安装配置到实战演示，全面解析这款工具的核心能力。

Gemini CLI教程

100万Token上下文：为什么这很重要

Gemini CLI 底层使用 Gemini 2.5 Pro 模型，继承了其超过 100 万 Token 的上下文窗口能力。这个数字意味着什么？大约相当于 2-3 个 Flask 规模的完整项目，或者十几个常见 Python 包的完整代码量。

要理解这一数字的意义，需要先了解 Token 和上下文窗口的概念。Token 是大语言模型处理文本的基本单位，一个 Token 大约对应英文中的 3/4 个单词，或中文中的 1-2 个字符。上下文窗口（Context Window）指模型在一次对话中能够同时「看到」和处理的最大 Token 数量。早期的 GPT-3.5 仅支持 4K Token 上下文，GPT-4 将其扩展到 128K，而 Gemini 2.5 Pro 的 100 万 Token 上下文意味着模型可以在单次交互中处理约 75 万个英文单词或数万行代码。这一能力的实现依赖于 Google 在注意力机制（Attention Mechanism）上的优化——传统 Transformer 架构的注意力计算复杂度随序列长度呈二次方增长，Google 通过环形注意力（Ring Attention）和稀疏注意力等技术大幅降低了长序列处理的计算开销。

对开发者而言，超长上下文带来的实际价值体现在三个方面：

整体架构分析——可以一次性将整个项目喂给模型进行全局理解
跨文件代码重构——不再需要逐文件解释上下文关系
复杂依赖关系梳理——模型能同时看到所有模块间的调用链路

在实际测试中，将开源 AI 智能体框架 SmallAgents 的完整代码导入 Gemini CLI 后，它能够准确分析出项目的主要模块职责、数据流向和设计模式使用情况，甚至指出潜在的架构问题并给出重构建议，包括函数复杂度优化和依赖关系改进方案。

安装与基础配置

环境准备

安装 Gemini CLI 前需要确保系统已安装 Node.js（推荐 V20 版本），根据操作系统下载对应安装包即可。

安装命令非常简单，复制 Gemini 官方提供的安装命令，在终端中运行：

Mac/Linux：打开 Terminal 直接执行
Windows：打开 CMD 执行

安装过程中会提示选择主题（默认暗色即可），随后需要登录 Google 账户完成认证。登录成功后，终端会显示默认使用 Gemini 2.5 Pro 模型。

常用命令速览

通过 help 命令可以查看所有可用操作，以下几个关键命令值得记住：

MCP 相关命令：管理和调用 MCP Server
Memory 命令：设置和管理记忆文件
工具列表命令：查看所有可用工具
! 前缀命令：执行 Shell 命令，如 !pwd 显示当前路径

实际开发中，建议直接在 VSCode 或 PyCharm 的内置终端中启动 Gemini CLI，这样可以无缝结合 IDE 的文件管理和代码编辑能力。

MCP Server扩展：让Gemini CLI能力倍增

MCP协议：AI工具的「USB接口」

MCP（Model Context Protocol，模型上下文协议）是 Anthropic 于 2024 年底开源的一项标准化协议，旨在为大语言模型提供统一的外部工具调用接口。MCP 采用客户端-服务器架构：AI 工具（如 Gemini CLI、Claude Code）作为 MCP 客户端，而各种外部服务（如文档检索、数据库查询、项目管理工具）作为 MCP Server 运行。两者之间通过 JSON-RPC 2.0 协议通信，MCP Server 向客户端暴露可调用的工具列表和参数定义，客户端根据用户意图自动选择合适的工具并发起调用。这种设计类似于 USB 协议之于硬件设备——一旦标准确立，任何开发者都可以编写符合协议的 MCP Server，从而让 AI 工具获得新的能力，而无需修改 AI 工具本身的代码。

如何配置MCP Server

MCP Server 的配置是 Gemini CLI 最具差异化的功能之一。通过编辑配置文件，可以为 Gemini CLI 接入各种外部工具。

配置步骤如下：

在终端中切换到 Gemini CLI 的配置路径
使用 nano 命令打开配置文件
在配置文件中添加 MCP Server 的 JSON 配置

以实测为例，配置了两个常用的 MCP Server：

Context7：能够获取绝大部分开源项目和库的最新文档，有效解决 LLM 训练数据滞后的问题。由于大语言模型的训练数据存在时间截止点（knowledge cutoff），对于快速迭代的开源项目，模型可能仍在使用已废弃的 API。Context7 通过实时检索最新文档，确保生成的代码基于当前版本的 API。
Taskmaster：能够生成产品需求文档（PRD）并将其拆解为可执行的子任务，帮助开发者将模糊的产品想法转化为结构化的开发计划。

配置完成后，在 Gemini CLI 中输入 /mcp 即可查看已配置的 MCP Server 及其支持的所有工具。

实战：用AutoGen开发AI智能体工作流

为了验证 MCP Server 的实际效果，我们测试了一个完整的开发场景——使用微软的 AutoGen 框架开发 AI 智能体工作流。

AutoGen 是微软研究院开源的多智能体对话框架，其核心理念是通过多个 AI 智能体之间的协作对话来完成复杂任务。与单一智能体模式不同，AutoGen 允许开发者定义多个具有不同角色和能力的智能体，这些智能体可以相互发送消息、审查彼此的输出并迭代优化结果。AutoGen 0.4 版本进行了重大架构重构，引入了基于事件驱动的异步通信机制和更灵活的智能体编排模式。这种多智能体协作模式模拟了软件工程中的代码审查（Code Review）流程，通过引入「第二双眼睛」来提高代码质量。

输入提示词后，Gemini CLI 首先通过 Context7 搜索到 AutoGen 的最新文档和新特性，然后基于最新 API 编写了一个包含三个智能体的工作流：

代码生成智能体：根据需求编写初始代码
代码审查智能体：对生成的代码进行审查并给出改进建议
代码集成智能体：综合前两个智能体的输出，生成最终优化代码

运行测试中，三个智能体协同工作：第一个智能体生成了查找第 N 个素数的 Python 函数，第二个智能体对代码进行审查并提出优化建议，第三个智能体整合所有信息输出了更完整的最终代码。整个流程无需手动干预，一次性运行成功。

记忆文件：让AI遵循你的开发规范

创建项目级记忆文件

记忆文件（Memory File）是 Gemini CLI 的另一个核心功能，它允许开发者为项目设定一套持久化的规则，让 AI 在后续所有交互中都遵循这些规范。

从技术本质上看，记忆文件是一种系统级提示词工程（System Prompt Engineering）的实践。在传统的 LLM 交互中，开发者需要在每次对话开头重复说明技术栈偏好、编码规范等约束条件，这不仅浪费 Token 配额，还容易因遗漏导致输出不一致。记忆文件将这些约束持久化为项目级配置，类似于 .editorconfig 或 .eslintrc 之于代码编辑器——它们定义了项目的「元规则」，在每次交互时自动注入到模型的上下文中。值得注意的是，这种模式正在成为 AI 编程工具的标准配置范式：Claude Code 中对应的功能是 CLAUDE.md 文件，Cursor 则使用 .cursorrules 文件。

创建方式是在项目根目录新建一个 GEMINI.md 文件，在其中定义开发规范。一个完整的记忆文件通常包含以下内容：

技术栈约束：如 Python 3.11、AutoGen 0.4、使用 venv 虚拟环境
环境配置说明：虚拟环境创建、激活方式、依赖安装命令
编程规范与代码风格：命名约定、注释要求等
项目结构定义：目录组织方式
工具使用策略：如"始终使用 Context7 搜索最新文档"、"所有代码示例使用中文注释"

设置完成后，通过 /memory refresh 刷新记忆文件，用 /memory show 确认加载成功。

实战效果验证

配置好记忆文件后，仅输入一句简单的提示词"为我开发一个能够制定旅游规划的 AI 智能体"，Gemini CLI 就自动遵循了记忆文件中的所有规则：使用 Python 3.11 构建、遵循项目规范、按照指定的目录结构组织代码。

它首先输出了分步开发计划，确认后开始创建项目文件和编写代码。遇到运行报错时，直接将错误信息粘贴给 Gemini CLI，它能快速定位并修复问题。最终成功运行后，输入"制定一个去尼泊尔的三天旅游计划"，智能体输出了包含每日行程、预算估算、交通方式和景点推荐的完整旅行方案。

Taskmaster集成：从需求到任务拆解

除了代码开发，Gemini CLI 配合 Taskmaster MCP Server 还能完成项目管理层面的工作。在测试中输入"开发一款 iOS 上运行的 TodoList App，生成 PRD 并拆解为 10 个子任务"，Gemini CLI 调用 Taskmaster 自动完成了：

生成完整的产品需求文档并写入文件
将 PRD 拆解为 10 个具体的开发子任务并保存

开发者可以基于这些拆解后的子任务，继续在 Gemini CLI 中逐步完成整个项目的开发，形成从需求分析到代码实现的完整闭环。

总结与展望

Gemini CLI 的发布标志着 AI 编程工具进入了一个新阶段。100 万 Token 的上下文窗口解决了大型项目分析的痛点，MCP Server 扩展机制提供了无限的能力拓展空间，而记忆文件功能则让 AI 编程从"随机应答"进化为"规范化开发"。

当前 AI 命令行编程工具市场已形成三足鼎立的格局：Anthropic 的 Claude Code 以代码理解深度和 agentic coding 能力著称，在复杂重构任务中表现突出；OpenAI 的 Codex CLI 依托 GPT 系列模型的广泛用户基础，强调与 ChatGPT 生态的无缝衔接；Google 的 Gemini CLI 则以超长上下文和免费额度作为差异化切入点。除命令行工具外，IDE 集成类工具如 GitHub Copilot、Cursor 和 Windsurf 也在争夺开发者市场，整个 AI 编程工具赛道在 2025 年进入白热化竞争阶段。

对于已经在使用 Claude Code 或 Codex CLI 的开发者来说，Gemini CLI 最大的差异化优势在于其超长上下文和灵活的 MCP 生态。而对于刚接触 AI 编程工具的开发者，Gemini CLI 的免费额度和相对简单的配置流程也降低了入门门槛。随着 MCP 生态的持续丰富，Gemini CLI 的实际开发能力还将进一步增强。

核心要点

Gemini CLI支持100万Token超长上下文窗口，可一次性分析2-3个Flask规模完整项目的代码架构
通过MCP Server扩展机制，可集成Context7获取最新文档、Taskmaster生成PRD并拆解任务等外部工具
记忆文件功能允许开发者定义持久化的开发规范，让AI在所有交互中遵循指定的技术栈、代码风格和项目结构
实测使用AutoGen框架成功开发了多智能体协作工作流，三个智能体分别负责代码生成、审查和集成优化
支持在VSCode和PyCharm等主流IDE的终端中直接使用，可无缝融入现有开发工作流