最近吴恩达说了一句话挺震撼的——他说自己现在几乎不再手写代码了,全交给AI编码系统代劳。你想想,这可是深度学习领域的教父级人物,连他都这样了,说明智能编码助手这个东西,真的不是玩具了。
对,而且他不光是自己用,还跟Google联合推了一门新课,专门讲Gemini CLI。这个工具其实挺有意思的,它是一个完全开源的智能编码助手,跟我们之前熟悉的Cursor、GitHub Copilot是同一赛道的,但定位有明显差异。
等一下,我想先帮听众理清一个概念。你说的智能编码助手,跟早期那种代码自动补全,比如最早的Copilot,区别到底在哪?
这个区别其实是本质性的。早期的代码补全,你可以理解为一个特别聪明的输入法——你打了半句,它猜下半句。但现在这一代工具,叫Agentic Coding Systems,智能体编码系统,它的能力完全不一样。你给它一个高层次的任务描述,比如说'帮我搭一个会议网站',它能自己把任务拆解成子任务,自己去调用文件系统、跑终端命令、调API,遇到问题还能动态调整策略。你看,这就不是补全了,这是一个有自主规划能力的数字员工。
嗯,所以它能直接在你的本地机器上执行操作?比如装个依赖包、跑个git命令这种?
没错,pip install、git操作、甚至用Playwright做浏览器自动化,这些它都能干。当然前提是你授权。吴恩达在课里说了一句话我印象特别深——'原型开发从未如此之快'。这确实是很多开发者现在的真实感受。
好,那我们来聊聊这门课本身。我看了一下课程大纲,它不是那种纯教你装个工具、敲几个命令的入门教程,设计得挺系统的。
对,课程设计有个很巧妙的地方——它用了一个贯穿始终的实战案例,就是筹办一场AI开发者大会。围绕这个场景,你要做会议网站、做营销素材、搭数据仪表盘、把播客内容转成社交媒体短视频。你看,这里面有纯编码任务,也有非编码任务,它其实在展示一个趋势:智能编码助手正在变成通用的数字工作助手。
这个趋势确实值得注意。那课程里有几个概念我觉得听众可能比较陌生,第一个就是上下文工程。这个词最近特别火,能展开说说吗?
上下文工程,Context Engineering,你可以把它理解为——怎么给AI喂信息,才能让它干活干得最好。这个概念是Shopify的CEO Tobi Lütke他们推广开的,2025年算是AI开发领域的核心能力之一了。在Gemini CLI里,它分几个层面。第一层是系统指令,你通过一个叫GEMINI.md的配置文件,定义项目级别的规则,相当于给AI设定角色和行为准则。第二层是会话记忆,让AI在多轮对话中记住项目状态,不用你每次都重新解释一遍。第三层是检索增强,就是精准地引用特定文件或文档给模型参考。
所以本质上就是——大模型的上下文窗口是有限的,哪怕Gemini 2.5 Pro有一百万token,你也得精心挑选往里面放什么。
完全正确。放什么、怎么放、什么时候放,这就是上下文工程的核心。做得好和做得差,AI输出的质量天差地别。
另一个我觉得很关键的概念是MCP,模型上下文协议。这个东西课程里反复提到,它到底解决了什么问题?
MCP是Anthropic在2024年底提出的一个开源标准协议。你可以这样理解——以前你想让AI调用一个外部工具,比如Canva的设计API,你得自己写集成代码,跟每个工具单独对接,特别麻烦。MCP做的事情就是定义了一个统一的接口标准。你部署一个符合MCP标准的服务器,任何支持MCP的AI客户端都能自动发现并使用它的能力。课程里就演示了同时连接Canva的MCP服务器和Google Workspace的MCP服务器,让Gemini CLI在一个工作流里既能做设计又能读写文档和日历,无缝切换。
这就像是给AI工具世界定了一个USB标准,即插即用。
哈哈,这个比喻特别好,就是这个意思。
课程还有一个高级模块是讲GitHub Actions自动化的,这个我觉得对团队开发特别有价值。
嗯,这部分其实代表了AI编码工具的一个重要演进方向——从交互式辅助走向无人值守的自动化。具体来说,你把Gemini CLI嵌入GitHub Actions的工作流里,当团队成员提交Pull Request的时候,系统自动触发AI做代码审查,检查bug、安全漏洞、代码风格问题,然后直接在PR里留评论和修改建议。这就不是个人助手了,这是团队级的自动化基础设施,7×24小时不间断地帮你把关代码质量。
说到这儿,我想聊聊Gemini CLI最大的差异化特点——完全开源。现在市面上Cursor、Copilot、Claude Code这些工具,竞争挺激烈的,开源这张牌到底意味着什么?
意味着很多。首先是透明度,Gemini CLI每一行代码都在GitHub上公开,包括系统提示词。你知道系统提示词对AI工具来说有多重要吗?它决定了AI在什么情况下该请求用户确认、怎么处理模糊指令、遇到错误怎么恢复。大多数商业工具把这个当核心机密,但Gemini CLI全公开了。对开发者来说,这是一个绝佳的学习机会——你能直接看到Google的工程师是怎么设计智能体行为规范的。其次是社区共建,目前已经合并了数千个来自社区的Pull Request,很多受欢迎的功能就是社区贡献的。
而且对企业用户来说,能审计每一行代码,在安全合规方面也是个很大的加分项。
对,这一点在企业环境里确实非常重要。再加上它跟Google生态的深度集成——原生支持Google Workspace、Google Cloud,以及Gemini 2.5系列模型在超长上下文窗口上的优势,处理大型代码库的时候特别有用。
最后帮大家总结一下。这门课的价值其实不只是学一个工具,更重要的是掌握智能编码的方法论——上下文工程怎么做、多工具怎么协调、自动化流水线怎么搭。不管你现在用的是Cursor还是Copilot,这些方法论都是通用的。
没错。而且从吴恩达亲自站台这件事本身就能看出来,智能编码助手已经不是什么前沿实验了,它就是现在进行时。不管你是资深开发者还是刚入行的新人,越早建立起跟AI协作编码的能力,越早受益。这门课在DeepLearning.AI平台上就能学,感兴趣的话值得花时间看看。