最近我发现一个挺有意思的现象——大家聊AI工具的时候,张口闭口就是ChatGPT、Claude、Midjourney,但Google自家有个工具,功能强得离谱,知道的人却不多。
你说的是Google AI Studio吧?
对,就是它。最近还搞了一次大更新,我觉得是时候好好聊聊了。你作为一直在用这个工具的人,先给大家说说它到底是什么?
简单来说,Google AI Studio是Google把自家Gemini系列模型开放出来的一个平台。但它跟你平时用的Gemini聊天界面完全不是一个量级的东西。你可以把标准Gemini想象成一辆自动挡的车,操作简单,上手就能开。而AI Studio呢,更像是给你一辆赛车,所有参数都暴露出来了——模型选择、温度、思考深度、输出格式,全都能自己调。而且这次更新最大的变化是,如果你已经订阅了Gemini Pro或者Ultra,现在可以直接把订阅绑定到AI Studio上,不用再额外花钱搞什么API Key了。
等等,这个变化其实挺关键的。以前要用AI Studio的付费功能,得自己去Google Cloud后台创建项目、生成API Key,然后按调用量付费,对普通人来说门槛太高了。
没错,现在等于是把消费者级别的订阅权益直接延伸到了开发者工具里。你登录之后系统自动识别你的订阅状态,绑定成功左侧的升级按钮就消失了,非常无感。而且就算你没有付费订阅,免费额度也相当慷慨,基础体验完全够用。
好,那我们来聊聊具体能干什么。我知道很多创作者最关心的一个点是——AI Studio生成的图片没有水印?
对,这是很多人选择AI Studio的核心原因。你在标准Gemini Pro里生成图片,右下角会有水印。但在AI Studio里,绑定了订阅之后,生成的图片是完全干净的,没有水印。而且它的控制粒度比标准Gemini强太多了。你可以直接选输出格式,比如只要图片不要文字——省得Gemini每次还跟你说一句'这是一张树懒的图片,希望你喜欢'。
哈哈,那句话确实有点多余。
对吧。然后宽高比可以直接下拉选择16:9、1:1、4:3,分辨率支持4K,还有一个特别实用的功能叫搜索接地。就是让模型在生成图片之前,先去Google搜索一下相关信息,然后基于真实世界的数据来生成。有人测试过,用它生成一个真实地点的日落场景,开启搜索接地之后,连街道上的真实店铺名字都能出现在画面里。
这个搜索接地本质上就是RAG对吧?检索增强生成。
嗯,原理是一样的。模型先把你的需求转化成搜索查询,从外部数据源拉回来相关信息,再注入到生成过程中。这样就大幅降低了AI瞎编的概率。不光图片生成能用,文本对话也能开启这个功能,还有Google地图接地,做旅行规划的时候特别好用。
除了图片,我注意到AI Studio还有一个文本转语音的功能,这个怎么样?
这个功能我觉得对内容创作者来说价值很大。它不是那种简单的单人朗读,而是支持多角色对话。你可以添加多个语音块,给每个角色分配不同的说话人和音色,音色库还挺丰富的,都能试听。最有意思的是它支持情感标注,你在文本里用方括号写上比如concerned、excited这种情绪词,AI就会自动调整语气。生成的音频可以直接下载,免费的。做播客、有声书、视频配音都能用。
说到这里其实已经很强了,但我觉得AI Studio最让人兴奋的部分应该是Build功能。
你说到点上了。Build功能才是真正改变游戏规则的东西。它的核心理念叫Vibe Coding——这个概念是Andrej Karpathy今年初提出的,就是你不用写代码,用自然语言描述你想要什么应用,AI帮你生成。
听起来跟其他的AI代码生成工具有点像?
表面上像,但AI Studio的Build有个关键差异——它不只是帮你写前端页面,它能自动集成Firebase。Firebase是Google的后端服务平台,提供数据库、用户认证、云存储这些东西。传统开发里,你要做一个支持用户登录、数据能存下来的应用,光后端可能就要搞好几周。现在Build能自动帮你配好Firestore数据库的结构,接好Google登录的认证流程,基本上把全栈开发的门槛降到了接近零。
你能举个具体例子吗?
有人演示过做一个类似NotebookLM的知识管理工具。用户可以创建不同的知识板块,往里面丢网页链接作为知识库,然后基于这些知识源跟AI对话问答。这个应用支持多用户登录,数据持久化存储,全程就是在聊天框里用自然语言描述需求,AI自动构建的。过程中还能迭代优化,你告诉它哪里要改,它就改。
这确实有点夸张了。不过我想问一个实际问题——配额够用吗?毕竟Build创建的应用运行时也在调用AI模型。
这是个好问题,也是目前AI Studio的一个痛点。它的配额体系说实话不太透明,据说连Google内部的人都不能完全说清每个模型的具体限额。但有一个特别简单的应对策略——遇到配额限制就换模型。比如图片生成模型配额用完了,切换到免费的Gemini 2.5 Flash Image就行。付费模型会标有Paid标签,免费模型的可用额度通常更大。
所以总结一下,AI Studio现在的定位其实已经不只是一个开发者工具了。
其实它正在变成一个面向所有人的AI创作平台。无水印图片生成、多角色语音合成、零代码应用构建,这三个能力组合在一起,而且大部分功能免费——我真的觉得它是目前最被低估的AI工具,没有之一。
我的建议是,大家可以先把它当成标准Gemini的一个高级补充。日常简单任务用Gemini聊天就够了,但需要精细控制、需要无水印图片、或者想快速搭个应用原型的时候,打开AI Studio,你会发现一个完全不同的世界。