播客频道 | Google AI Studio Annotate App详解：画一画就能改代码的Vibe Coding新玩法

今天想聊一个让我第一次看到就觉得'这也行？'的功能。Google AI Studio最近上了一个叫Annotate App的东西，简单说就是——你在前端界面上直接涂涂画画，AI就帮你改代码。对，我第一次用的时候也觉得挺离谱的。你想啊，以前我们用Cursor也好，ChatGPT也好，想改个UI上的东西，你得打字描述'请把左上角第二个图标换成咖啡豆'，对吧？但现在你直接拿画笔在那个图标上画个圈，旁边写上'换成咖啡豆'，回车，搞定了。这个操作方式让我想到一个词——Vibe Coding，氛围编程。这个概念是Andrej Karpathy今年年初提的，他是前特斯拉AI总监、OpenAI联合创始人之一。他的意思是说，开发者不用再逐行写代码了，你只需要传达意图，AI来帮你实现。Annotate App某种意义上是把这个理念从文字层面推到了视觉层面。嗯，其实你仔细想想AI辅助编程的演进路线就很清楚了。最早是GitHub Copilot那种代码补全，你写一半它猜后面；然后是ChatGPT那种对话式的，你用自然语言描述需求；再后来是Agent模式，像Claude Code、Cursor Agent，AI自己规划任务、读写文件。Annotate App可以说是第四个阶段的雏形了——它引入了空间信息。AI不光知道你要做什么，还精确知道你要在哪里做。你说的这个'空间信息'特别关键。我之前用其他工具改UI的时候，最痛苦的就是描述位置。你说'那个按钮'，AI可能找错，你说'页面右上角第三个元素'，又觉得自己在写CSS选择器。哈哈对，本质上前端开发就是视觉驱动的工作嘛。你用视觉的方式表达视觉需求，逻辑上完全说得通。我试过一个更直观的操作——用箭头指向一个按钮，旁边写'make this pink'，按钮颜色直接就变了。就跟你在白板上给设计师画草图一样。这听起来确实很酷。但是我知道你实际用下来也踩了不少坑，对吧？踩坑那是必须的。其实这个功能在前端原型阶段确实效率炸裂，但Google AI Studio作为一个完整的开发环境来用，短板还是很明显的。最大的问题是环境变量管理。你知道正常开发中，API密钥这些敏感信息是放在.env文件里的，代码通过process.env去读取，这样密钥就不会被推到GitHub上泄露。但Google AI Studio对这块的支持基本是缺失的。等等，这个问题有多严重？如果API密钥泄露到GitHub上会怎样？非常严重。有自动化扫描工具专门盯着GitHub上新提交的代码，几分钟之内就能发现泄露的密钥。轻则你的API被人盗用产生高额账单，重则数据泄露。所以业界有个'十二要素应用'方法论，其中一条核心原则就是配置和代码必须严格分离。Google AI Studio对自家的API生态支持没问题，但外部API的密钥管理基本无能为力。那Firebase呢？这可是Google自家的后端服务，按理说应该天然适配吧？你会这么想很正常，但实际上也不太顺畅。Firebase的配置涉及项目ID、API Key、Auth Domain、Storage Bucket一大堆变量。虽然前端SDK用的那些配置是公开的，但服务端的Admin SDK密钥和服务账号凭证是高度敏感的，必须通过环境变量安全管理。这恰恰是Google AI Studio的短板。有个开发者叫Corbin，他的评价很直接——这是一个'过于封闭的编码环境'。所以本质上，Google AI Studio不是要做一个全能型IDE，它是在Vibe Coding这条路上做到极致？对，我觉得Google的战略意图很清楚。AI Studio最早就是Gemini模型的调试工具，2025年扩展成了轻量级全栈开发环境，有代码编辑器、实时预览、一键部署。它的目标是降低Gemini API的使用门槛，把开发者锁在Google的AI生态里。Annotate App就是这个策略最直观的体现。那对于普通开发者来说，怎么用好这个工具？你有什么实操建议吗？我推荐一个三阶段策略。第一阶段，用Google AI Studio搞定前端和核心逻辑。这个阶段Annotate App的效率优势最明显，你可以快速搭界面、用虚拟数据模拟登录登出、接入Gemini API实现核心业务。第二阶段，把代码导出来，在Cursor这种更完整的开发环境里集成Firebase认证、数据库这些后端服务。第三阶段就是商业化上线，加支付、加订阅管理。说到Cursor，能不能展开讲讲它和Google AI Studio的区别？很多听众可能两个都在用。好问题。Cursor本质上是基于VS Code深度定制的AI原生代码编辑器，它是桌面端的，可以直接访问你的本地文件系统、终端、Git仓库和环境变量。它的AI能力嵌入到了编辑器的每个操作环节——Tab补全、内联编辑、多文件上下文对话、Agent模式，全栈开发场景下有天然优势。而Google AI Studio是浏览器端的轻量环境。两者的差异本质上是'云端轻量化'和'本地重量级'两条路线的分野。嗯，所以不是说谁替代谁，而是各有各的最佳使用场景。完全正确。Google AI Studio适合快速把脑子里的想法变成可交互的前端原型，Cursor适合做工程化的全栈开发，Claude Code在复杂推理和代码重构上更强。重点不是找'最好的'工具，而是搞清楚每个工具最适合干什么。最后我想说一点感受。当你可以直接在界面上画个圈、写句话就能改变应用外观的时候，编程的门槛确实又降了一个台阶。从代码补全到对话编程，再到现在的视觉标注，每一步都在让'表达意图'这件事变得更简单。是的，而且这个方向的想象空间还很大。现在只是在前端界面上画画标注，未来如果能结合更复杂的视觉语义理解，比如你直接手绘一个交互流程图，AI就能生成对应的页面和逻辑——那才是真正的'所想即所得'。Google在这条赛道上押了重注，接下来就看他们能把这个体验做到什么程度了。

Google AI Studio Annotate App详解：画一画就能改代码的Vibe Coding新玩法

更多播客

AI热点风向标·06月07日午间版

AI热点风向标·06月07日早间版

每日AI新鲜事·06月07日早间播报