播客频道 | 吴恩达新课：用Gemini CLI开源智能体革新代码开发

最近吴恩达说了一句话挺震撼的——他说自己现在几乎不再手写代码了，全交给AI编码系统代劳。你想想，这可是深度学习领域的教父级人物，连他都这样了，说明智能编码助手这个东西，真的不是玩具了。对，而且他不光是自己用，还跟Google联合推了一门新课，专门讲Gemini CLI。这个工具其实挺有意思的，它是一个完全开源的智能编码助手，跟我们之前熟悉的Cursor、GitHub Copilot是同一赛道的，但定位有明显差异。等一下，我想先帮听众理清一个概念。你说的智能编码助手，跟早期那种代码自动补全，比如最早的Copilot，区别到底在哪？这个区别其实是本质性的。早期的代码补全，你可以理解为一个特别聪明的输入法——你打了半句，它猜下半句。但现在这一代工具，叫Agentic Coding Systems，智能体编码系统，它的能力完全不一样。你给它一个高层次的任务描述，比如说'帮我搭一个会议网站'，它能自己把任务拆解成子任务，自己去调用文件系统、跑终端命令、调API，遇到问题还能动态调整策略。你看，这就不是补全了，这是一个有自主规划能力的数字员工。嗯，所以它能直接在你的本地机器上执行操作？比如装个依赖包、跑个git命令这种？没错，pip install、git操作、甚至用Playwright做浏览器自动化，这些它都能干。当然前提是你授权。吴恩达在课里说了一句话我印象特别深——'原型开发从未如此之快'。这确实是很多开发者现在的真实感受。好，那我们来聊聊这门课本身。我看了一下课程大纲，它不是那种纯教你装个工具、敲几个命令的入门教程，设计得挺系统的。对，课程设计有个很巧妙的地方——它用了一个贯穿始终的实战案例，就是筹办一场AI开发者大会。围绕这个场景，你要做会议网站、做营销素材、搭数据仪表盘、把播客内容转成社交媒体短视频。你看，这里面有纯编码任务，也有非编码任务，它其实在展示一个趋势：智能编码助手正在变成通用的数字工作助手。这个趋势确实值得注意。那课程里有几个概念我觉得听众可能比较陌生，第一个就是上下文工程。这个词最近特别火，能展开说说吗？上下文工程，Context Engineering，你可以把它理解为——怎么给AI喂信息，才能让它干活干得最好。这个概念是Shopify的CEO Tobi Lütke他们推广开的，2025年算是AI开发领域的核心能力之一了。在Gemini CLI里，它分几个层面。第一层是系统指令，你通过一个叫GEMINI.md的配置文件，定义项目级别的规则，相当于给AI设定角色和行为准则。第二层是会话记忆，让AI在多轮对话中记住项目状态，不用你每次都重新解释一遍。第三层是检索增强，就是精准地引用特定文件或文档给模型参考。所以本质上就是——大模型的上下文窗口是有限的，哪怕Gemini 2.5 Pro有一百万token，你也得精心挑选往里面放什么。完全正确。放什么、怎么放、什么时候放，这就是上下文工程的核心。做得好和做得差，AI输出的质量天差地别。另一个我觉得很关键的概念是MCP，模型上下文协议。这个东西课程里反复提到，它到底解决了什么问题？ MCP是Anthropic在2024年底提出的一个开源标准协议。你可以这样理解——以前你想让AI调用一个外部工具，比如Canva的设计API，你得自己写集成代码，跟每个工具单独对接，特别麻烦。MCP做的事情就是定义了一个统一的接口标准。你部署一个符合MCP标准的服务器，任何支持MCP的AI客户端都能自动发现并使用它的能力。课程里就演示了同时连接Canva的MCP服务器和Google Workspace的MCP服务器，让Gemini CLI在一个工作流里既能做设计又能读写文档和日历，无缝切换。这就像是给AI工具世界定了一个USB标准，即插即用。哈哈，这个比喻特别好，就是这个意思。课程还有一个高级模块是讲GitHub Actions自动化的，这个我觉得对团队开发特别有价值。嗯，这部分其实代表了AI编码工具的一个重要演进方向——从交互式辅助走向无人值守的自动化。具体来说，你把Gemini CLI嵌入GitHub Actions的工作流里，当团队成员提交Pull Request的时候，系统自动触发AI做代码审查，检查bug、安全漏洞、代码风格问题，然后直接在PR里留评论和修改建议。这就不是个人助手了，这是团队级的自动化基础设施，7×24小时不间断地帮你把关代码质量。说到这儿，我想聊聊Gemini CLI最大的差异化特点——完全开源。现在市面上Cursor、Copilot、Claude Code这些工具，竞争挺激烈的，开源这张牌到底意味着什么？意味着很多。首先是透明度，Gemini CLI每一行代码都在GitHub上公开，包括系统提示词。你知道系统提示词对AI工具来说有多重要吗？它决定了AI在什么情况下该请求用户确认、怎么处理模糊指令、遇到错误怎么恢复。大多数商业工具把这个当核心机密，但Gemini CLI全公开了。对开发者来说，这是一个绝佳的学习机会——你能直接看到Google的工程师是怎么设计智能体行为规范的。其次是社区共建，目前已经合并了数千个来自社区的Pull Request，很多受欢迎的功能就是社区贡献的。而且对企业用户来说，能审计每一行代码，在安全合规方面也是个很大的加分项。对，这一点在企业环境里确实非常重要。再加上它跟Google生态的深度集成——原生支持Google Workspace、Google Cloud，以及Gemini 2.5系列模型在超长上下文窗口上的优势，处理大型代码库的时候特别有用。最后帮大家总结一下。这门课的价值其实不只是学一个工具，更重要的是掌握智能编码的方法论——上下文工程怎么做、多工具怎么协调、自动化流水线怎么搭。不管你现在用的是Cursor还是Copilot，这些方法论都是通用的。没错。而且从吴恩达亲自站台这件事本身就能看出来，智能编码助手已经不是什么前沿实验了，它就是现在进行时。不管你是资深开发者还是刚入行的新人，越早建立起跟AI协作编码的能力，越早受益。这门课在DeepLearning.AI平台上就能学，感兴趣的话值得花时间看看。

吴恩达新课：用Gemini CLI开源智能体革新代码开发

更多播客

AI热点风向标·06月07日午间版

AI热点风向标·06月07日早间版

每日AI新鲜事·06月07日早间播报