播客频道 | Google AI Studio使用教程：免费生成无水印图片、AI语音与零代码应用

最近我发现一个挺有意思的现象——大家聊AI工具的时候，张口闭口就是ChatGPT、Claude、Midjourney，但Google自家有个工具，功能强得离谱，知道的人却不多。你说的是Google AI Studio吧？对，就是它。最近还搞了一次大更新，我觉得是时候好好聊聊了。你作为一直在用这个工具的人，先给大家说说它到底是什么？简单来说，Google AI Studio是Google把自家Gemini系列模型开放出来的一个平台。但它跟你平时用的Gemini聊天界面完全不是一个量级的东西。你可以把标准Gemini想象成一辆自动挡的车，操作简单，上手就能开。而AI Studio呢，更像是给你一辆赛车，所有参数都暴露出来了——模型选择、温度、思考深度、输出格式，全都能自己调。而且这次更新最大的变化是，如果你已经订阅了Gemini Pro或者Ultra，现在可以直接把订阅绑定到AI Studio上，不用再额外花钱搞什么API Key了。等等，这个变化其实挺关键的。以前要用AI Studio的付费功能，得自己去Google Cloud后台创建项目、生成API Key，然后按调用量付费，对普通人来说门槛太高了。没错，现在等于是把消费者级别的订阅权益直接延伸到了开发者工具里。你登录之后系统自动识别你的订阅状态，绑定成功左侧的升级按钮就消失了，非常无感。而且就算你没有付费订阅，免费额度也相当慷慨，基础体验完全够用。好，那我们来聊聊具体能干什么。我知道很多创作者最关心的一个点是——AI Studio生成的图片没有水印？对，这是很多人选择AI Studio的核心原因。你在标准Gemini Pro里生成图片，右下角会有水印。但在AI Studio里，绑定了订阅之后，生成的图片是完全干净的，没有水印。而且它的控制粒度比标准Gemini强太多了。你可以直接选输出格式，比如只要图片不要文字——省得Gemini每次还跟你说一句'这是一张树懒的图片，希望你喜欢'。哈哈，那句话确实有点多余。对吧。然后宽高比可以直接下拉选择16:9、1:1、4:3，分辨率支持4K，还有一个特别实用的功能叫搜索接地。就是让模型在生成图片之前，先去Google搜索一下相关信息，然后基于真实世界的数据来生成。有人测试过，用它生成一个真实地点的日落场景，开启搜索接地之后，连街道上的真实店铺名字都能出现在画面里。这个搜索接地本质上就是RAG对吧？检索增强生成。嗯，原理是一样的。模型先把你的需求转化成搜索查询，从外部数据源拉回来相关信息，再注入到生成过程中。这样就大幅降低了AI瞎编的概率。不光图片生成能用，文本对话也能开启这个功能，还有Google地图接地，做旅行规划的时候特别好用。除了图片，我注意到AI Studio还有一个文本转语音的功能，这个怎么样？这个功能我觉得对内容创作者来说价值很大。它不是那种简单的单人朗读，而是支持多角色对话。你可以添加多个语音块，给每个角色分配不同的说话人和音色，音色库还挺丰富的，都能试听。最有意思的是它支持情感标注，你在文本里用方括号写上比如concerned、excited这种情绪词，AI就会自动调整语气。生成的音频可以直接下载，免费的。做播客、有声书、视频配音都能用。说到这里其实已经很强了，但我觉得AI Studio最让人兴奋的部分应该是Build功能。你说到点上了。Build功能才是真正改变游戏规则的东西。它的核心理念叫Vibe Coding——这个概念是Andrej Karpathy今年初提出的，就是你不用写代码，用自然语言描述你想要什么应用，AI帮你生成。听起来跟其他的AI代码生成工具有点像？表面上像，但AI Studio的Build有个关键差异——它不只是帮你写前端页面，它能自动集成Firebase。Firebase是Google的后端服务平台，提供数据库、用户认证、云存储这些东西。传统开发里，你要做一个支持用户登录、数据能存下来的应用，光后端可能就要搞好几周。现在Build能自动帮你配好Firestore数据库的结构，接好Google登录的认证流程，基本上把全栈开发的门槛降到了接近零。你能举个具体例子吗？有人演示过做一个类似NotebookLM的知识管理工具。用户可以创建不同的知识板块，往里面丢网页链接作为知识库，然后基于这些知识源跟AI对话问答。这个应用支持多用户登录，数据持久化存储，全程就是在聊天框里用自然语言描述需求，AI自动构建的。过程中还能迭代优化，你告诉它哪里要改，它就改。这确实有点夸张了。不过我想问一个实际问题——配额够用吗？毕竟Build创建的应用运行时也在调用AI模型。这是个好问题，也是目前AI Studio的一个痛点。它的配额体系说实话不太透明，据说连Google内部的人都不能完全说清每个模型的具体限额。但有一个特别简单的应对策略——遇到配额限制就换模型。比如图片生成模型配额用完了，切换到免费的Gemini 2.5 Flash Image就行。付费模型会标有Paid标签，免费模型的可用额度通常更大。所以总结一下，AI Studio现在的定位其实已经不只是一个开发者工具了。其实它正在变成一个面向所有人的AI创作平台。无水印图片生成、多角色语音合成、零代码应用构建，这三个能力组合在一起，而且大部分功能免费——我真的觉得它是目前最被低估的AI工具，没有之一。我的建议是，大家可以先把它当成标准Gemini的一个高级补充。日常简单任务用Gemini聊天就够了，但需要精细控制、需要无水印图片、或者想快速搭个应用原型的时候，打开AI Studio，你会发现一个完全不同的世界。

Google AI Studio使用教程：免费生成无水印图片、AI语音与零代码应用

更多播客

AI热点风向标·06月07日午间版

AI热点风向标·06月07日早间版

每日AI新鲜事·06月07日早间播报