最近Google悄悄放了一个大招,搞了个叫Gemini CLI的东西——简单说就是一个跑在终端里的AI编程助手。我知道你已经上手玩了一阵子了,先给大家说说,这东西到底是什么定位?"},
{"speaker": "guest", "text": "嗯,你可以把它理解为一个住在你终端里的AI程序员搭档。它底层用的是Gemini 2.5 Pro模型,就是Google目前在代码理解方面最强的那个版本。跟我们平时用的GitHub Copilot那种IDE插件不一样,它完全就是在命令行里工作的,你打开终端,敲个命令,就能跟它聊代码、让它帮你分析项目、生成文档、修Bug,什么都行。"},
{"speaker": "host", "text": "等一下,我先替听众问一个基本问题——为什么我要在终端里用AI?我在网页上用ChatGPT或者在VS Code里用Copilot不是挺好的吗?"},
{"speaker": "guest", "text": "这个问题特别好。你想啊,很多开发者日常工作就是泡在终端里的,特别是做后端、做运维、搞DevOps的同学,可能一天到晚都在SSH连远程服务器。这种场景下你没有VS Code,没有花哨的IDE,但终端是永远在的。而且Gemini CLI有一个杀手级的能力——它会自动分析你当前目录下的整个项目结构,建立上下文索引。所以它给你的回答不是泛泛而谈,而是真正理解了你这个项目之后的针对性建议。"},
{"speaker": "host", "text": "这个项目感知能力确实听起来很诱人。那它是怎么做到的?毕竟一个项目可能有成百上千个文件。"},
{"speaker": "guest", "text": "这就要说到Gemini 2.5 Pro的一个核心优势了——它支持最高100万token的上下文窗口。打个比方,早期的GPT-3.5只能一次看4096个token,大概就是一两个文件的量。而100万token意味着它可以一次性"阅读"数十万行代码。所以当你在项目目录里启动Gemini CLI的时候,它会递归扫描你的文件,识别源代码、配置文件、依赖声明,然后把这些信息整理成结构化的上下文,每次对话都带着这些背景知识去问模型。"},
{"speaker": "host", "text": "相当于它先把你的项目通读了一遍,然后再回答问题。这个体验确实跟直接把代码片段粘贴到ChatGPT里完全不一样。好,那我们聊聊怎么装这个东西吧,门槛高不高?"},
{"speaker": "guest", "text": "其实特别简单,两步就搞定。第一步,你需要有Node.js环境,版本要v20以上。因为Gemini CLI是用TypeScript写的,需要Node.js来跑。你在终端里敲node --version看一下就知道了。如果没装的话,Mac和Linux用户用Homebrew一行命令就搞定,Windows也有安装包。"},
{"speaker": "host", "text": "对,这里插一句,如果你是Python开发者可能对Node.js不太熟——你可以把Node.js理解为JavaScript世界的Python解释器,npm就相当于pip。"},
{"speaker": "guest", "text": "没错,类比得很准确。第二步就是用npm全局安装:npm install -g @google/gemini-cli。这里的@google/前缀表示这是Google官方的包,-g表示全局安装,装完之后你在任何目录下都能直接敲gemini来启动。整个过程可能就一两分钟。"},
{"speaker": "host", "text": "装好之后第一次启动会发生什么?"},
{"speaker": "guest", "text": "第一次启动会让你选认证方式,有三种:Google账号登录、API Key、还有Vertex AI。对于个人开发者来说,直接选Google账号登录就行,最方便。选完之后它会自动打开浏览器让你登录Google账号。这背后用的是OAuth 2.0的设备授权流程,一个很巧妙的设计——你的密码始终只在浏览器里输入,永远不会经过CLI工具本身,安全性很有保障。"},
{"speaker": "host", "text": "这个细节不错。那API Key和Vertex AI那两种方式是给什么人用的?"},
{"speaker": "guest", "text": "API Key更适合自动化场景,比如你要在CI/CD流水线里集成Gemini的能力,没有人去点浏览器登录嘛。Vertex AI则是面向企业用户的,已经在用Google Cloud的公司可以走这个通道,有更细粒度的权限控制。"},
{"speaker": "host", "text": "明白了。那说到大家最关心的问题——免费吗?"},
{"speaker": "guest", "text": "免费!而且额度还挺慷慨的。目前用个人Google账号登录的话,每分钟60次请求、每天1000次请求。对于个人开发者日常使用来说完全够了。而且它退出的时候会显示一个统计面板,告诉你这次会话调了多少次API、成功率多少,你可以很清楚地知道自己的用量。"},
{"speaker": "host", "text": "每天1000次确实挺大方的。那我们来说说实际使用体验吧,你第一次用它做了什么?"},
{"speaker": "guest", "text": "我拿一个Python的To-Do List小项目试的。在项目目录里启动Gemini CLI之后,它先花了几秒钟扫描项目文件建立索引。然后我问了一个很简单的问题:这个项目是用什么语言写的?它不光告诉我是Python,还说明了判断依据——它看到了.py文件和pyproject.toml配置文件。这说明它对现代Python项目的工具链是有准确认知的。"},
{"speaker": "host", "text": "嗯,pyproject.toml这个它都认识,说明对Python生态的理解还是比较到位的。那除了这种简单问题,它在实际开发中能干什么?"},
{"speaker": "guest", "text": "场景其实很多。比如你新加入一个团队,接手一个完全陌生的代码库,直接问它项目架构是什么样的、用了哪些框架、核心模块之间怎么交互,它能给你一个很清晰的概览。再比如文档生成,让它基于代码自动写README、API文档。还有Bug排查,因为它理解跨文件的调用链,所以定位问题比你自己grep半天要快得多。代码重构、生成测试用例这些也都在行。"},
{"speaker": "host", "text": "听起来确实实用。不过现在终端AI工具也不少了,Claude Code、Aider都挺火的,Gemini CLI跟它们比有什么独特的地方?"},
{"speaker": "guest", "text": "各有特色吧。Claude Code是Anthropic出的,长文本处理能力也很强。Aider是开源的,最大的优势是可以接入各种模型,GPT-4、Claude、本地模型都行,而且能直接编辑Git仓库里的文件自动生成commit,特别灵活。Gemini CLI的核心优势我觉得有三点:一是免费额度真的慷慨;二是那个100万token的超长上下文窗口,处理大项目的时候优势明显;三是跟Google生态的天然集成,如果你用Google Cloud或者Firebase,它会特别顺手。"},
{"speaker": "host", "text": "不过你也提到了它的局限——只能用Gemini模型,不能像Aider那样换后端。"},
{"speaker": "guest", "text": "对,这是目前最大的限制。不过说实话,Gemini 2.5 Pro在代码任务上的表现已经很强了,对大多数开发者来说够用。而且Google迭代速度很快,我装的时候才0.13版本,说不定过几个月功能又会有大变化。"},
{"speaker": "host", "text": "所以总结一下的话,如果你是一个终端重度用户,平时就喜欢在命令行里干活,Gemini CLI绝对值得花五分钟装一个试试。Node.js v20以上、一行npm命令、一个Google账号,就这三样东西,门槛真的很低。而且那个项目感知能力,用过之后你会觉得以前往ChatGPT里粘代码片段的方式实在太原始了。"},
{"speaker": "guest", "text": "哈哈没错,就像从翻字典进化到了有个懂你项目的同事坐在旁边随时可以问一样。强烈建议大家去geminicli.com看看官方文档,毕竟AI工具更新太快,今天聊的细节说不定下个月就变了。"}
],