今天想聊一个让我第一次看到就觉得'这也行?'的功能。Google AI Studio最近上了一个叫Annotate App的东西,简单说就是——你在前端界面上直接涂涂画画,AI就帮你改代码。
对,我第一次用的时候也觉得挺离谱的。你想啊,以前我们用Cursor也好,ChatGPT也好,想改个UI上的东西,你得打字描述'请把左上角第二个图标换成咖啡豆',对吧?但现在你直接拿画笔在那个图标上画个圈,旁边写上'换成咖啡豆',回车,搞定了。
这个操作方式让我想到一个词——Vibe Coding,氛围编程。这个概念是Andrej Karpathy今年年初提的,他是前特斯拉AI总监、OpenAI联合创始人之一。他的意思是说,开发者不用再逐行写代码了,你只需要传达意图,AI来帮你实现。Annotate App某种意义上是把这个理念从文字层面推到了视觉层面。
嗯,其实你仔细想想AI辅助编程的演进路线就很清楚了。最早是GitHub Copilot那种代码补全,你写一半它猜后面;然后是ChatGPT那种对话式的,你用自然语言描述需求;再后来是Agent模式,像Claude Code、Cursor Agent,AI自己规划任务、读写文件。Annotate App可以说是第四个阶段的雏形了——它引入了空间信息。AI不光知道你要做什么,还精确知道你要在哪里做。
你说的这个'空间信息'特别关键。我之前用其他工具改UI的时候,最痛苦的就是描述位置。你说'那个按钮',AI可能找错,你说'页面右上角第三个元素',又觉得自己在写CSS选择器。
哈哈对,本质上前端开发就是视觉驱动的工作嘛。你用视觉的方式表达视觉需求,逻辑上完全说得通。我试过一个更直观的操作——用箭头指向一个按钮,旁边写'make this pink',按钮颜色直接就变了。就跟你在白板上给设计师画草图一样。
这听起来确实很酷。但是我知道你实际用下来也踩了不少坑,对吧?
踩坑那是必须的。其实这个功能在前端原型阶段确实效率炸裂,但Google AI Studio作为一个完整的开发环境来用,短板还是很明显的。最大的问题是环境变量管理。你知道正常开发中,API密钥这些敏感信息是放在.env文件里的,代码通过process.env去读取,这样密钥就不会被推到GitHub上泄露。但Google AI Studio对这块的支持基本是缺失的。
等等,这个问题有多严重?如果API密钥泄露到GitHub上会怎样?
非常严重。有自动化扫描工具专门盯着GitHub上新提交的代码,几分钟之内就能发现泄露的密钥。轻则你的API被人盗用产生高额账单,重则数据泄露。所以业界有个'十二要素应用'方法论,其中一条核心原则就是配置和代码必须严格分离。Google AI Studio对自家的API生态支持没问题,但外部API的密钥管理基本无能为力。
那Firebase呢?这可是Google自家的后端服务,按理说应该天然适配吧?
你会这么想很正常,但实际上也不太顺畅。Firebase的配置涉及项目ID、API Key、Auth Domain、Storage Bucket一大堆变量。虽然前端SDK用的那些配置是公开的,但服务端的Admin SDK密钥和服务账号凭证是高度敏感的,必须通过环境变量安全管理。这恰恰是Google AI Studio的短板。有个开发者叫Corbin,他的评价很直接——这是一个'过于封闭的编码环境'。
所以本质上,Google AI Studio不是要做一个全能型IDE,它是在Vibe Coding这条路上做到极致?
对,我觉得Google的战略意图很清楚。AI Studio最早就是Gemini模型的调试工具,2025年扩展成了轻量级全栈开发环境,有代码编辑器、实时预览、一键部署。它的目标是降低Gemini API的使用门槛,把开发者锁在Google的AI生态里。Annotate App就是这个策略最直观的体现。
那对于普通开发者来说,怎么用好这个工具?你有什么实操建议吗?
我推荐一个三阶段策略。第一阶段,用Google AI Studio搞定前端和核心逻辑。这个阶段Annotate App的效率优势最明显,你可以快速搭界面、用虚拟数据模拟登录登出、接入Gemini API实现核心业务。第二阶段,把代码导出来,在Cursor这种更完整的开发环境里集成Firebase认证、数据库这些后端服务。第三阶段就是商业化上线,加支付、加订阅管理。
说到Cursor,能不能展开讲讲它和Google AI Studio的区别?很多听众可能两个都在用。
好问题。Cursor本质上是基于VS Code深度定制的AI原生代码编辑器,它是桌面端的,可以直接访问你的本地文件系统、终端、Git仓库和环境变量。它的AI能力嵌入到了编辑器的每个操作环节——Tab补全、内联编辑、多文件上下文对话、Agent模式,全栈开发场景下有天然优势。而Google AI Studio是浏览器端的轻量环境。两者的差异本质上是'云端轻量化'和'本地重量级'两条路线的分野。
嗯,所以不是说谁替代谁,而是各有各的最佳使用场景。
完全正确。Google AI Studio适合快速把脑子里的想法变成可交互的前端原型,Cursor适合做工程化的全栈开发,Claude Code在复杂推理和代码重构上更强。重点不是找'最好的'工具,而是搞清楚每个工具最适合干什么。
最后我想说一点感受。当你可以直接在界面上画个圈、写句话就能改变应用外观的时候,编程的门槛确实又降了一个台阶。从代码补全到对话编程,再到现在的视觉标注,每一步都在让'表达意图'这件事变得更简单。
是的,而且这个方向的想象空间还很大。现在只是在前端界面上画画标注,未来如果能结合更复杂的视觉语义理解,比如你直接手绘一个交互流程图,AI就能生成对应的页面和逻辑——那才是真正的'所想即所得'。Google在这条赛道上押了重注,接下来就看他们能把这个体验做到什么程度了。