哎李博,你上次跟我说有个免费的AI工具特别值得玩,我一直没顾上看,是哪个来着?
Google AI Studio啊!2.0刚更新完,我跟你说,这东西被严重低估了。
就Google那个?我印象里不就是个API调试台吗,之前随便点过两下就关了。
哈哈,你这就是典型的错过了。现在它已经不是那个东西了。你想想,大家每个月花20美元订ChatGPT Plus,花这个订那个的,结果Google把Gemini 3.1 Pro、VO3视频生成、图像生成、语音合成全塞进去了,免费的。
等会儿,免费?Gemini 3.1 Pro也免费?那不是他们最强的模型吗?
对,而且给你100万token的上下文窗口。你知道这意味着什么吗?大概1500页文本,一整个代码库都能塞进去。
一百万token……我们产品之前对接GPT-4的时候还在纠结128K够不够用呢。这直接翻了快8倍?
是的。技术上它用了Ring Attention和稀疏注意力机制,解决了传统Transformer注意力计算量随长度平方增长的问题。但你不用管这些,你只需要知道——整本书扔进去,它全记得住。
那它有两个模型嘛,Flash和Pro,日常怎么选?
简单,Flash做探索,Pro出结果。Flash两秒内响应,适合你快速试想法。Pro慢一点但准确性高,复杂推理、创意写作用它。而且切换模型不丢上下文,这个设计挺贴心的。
嗯这个我理解。但说实话,模型强不强各家都在卷,真正让我兴奋的是你之前提的那个Vibe Coding?用自然语言写应用?
来了来了,这才是重头戏。Vibe Coding这个概念是Andrej Karpathy今年提的,就是你不写代码了,你用人话描述你要什么,AI帮你从零生成整个应用。前端后端全包。
这跟低代码平台有啥区别?我们公司也用过那种拖拽式的。
本质区别。低代码是在预设模板里拖组件,你被框死了。Vibe Coding是大模型从零生成任意逻辑的代码,理论上没有功能边界。你想做什么就描述什么。
真的假的,那我说我要做个YouTube创意生成器,它就能做出来?
就这个例子,你跟它说:帮我做个YouTube内容创意生成器,要问用户细分领域,分析热门话题,生成10个视频创意带标题和预估播放量,深色主题。它就实时生成完整代码,右边面板直接预览。
那第一版肯定不完美吧,怎么改?
这就是精髓了——Annotation模式。你直接高亮界面上任何一块,说'这里加个导出CSV按钮',代码自动更新。
这不就是我们产品经理的梦想吗!以后需求文档写完自己就能出原型了。
你们产品经理就知道出原型哈哈。不过说真的,社区已经有人用它做贪吃蛇、多人在线游戏、广告本地化工具了。核心门槛不是编程能力,是你能不能清晰描述需求。
得了吧,描述需求这不就是我的专业嘛。
行行行,产品经理赢了。
那多媒体那块呢?VO3视频生成我特别感兴趣,我们团队一直想做短视频内容。
VO3支持文本直接生成视频、图片生成视频、首尾帧过渡,6秒8秒时长都行,最高4K。而且你可以在一个界面里完成全流程:Gemini写脚本,Nano Banana生成视觉素材,VO3做视频,TTS加配音。
一个平台全搞定?不用在五六个工具之间来回跳了?
对。还有个细节,所有VO3生成的视频都带SynthID数字水印,肉眼看不见,但能被检测到。裁剪压缩加滤镜都去不掉。这是Google应对AI内容监管的技术手段。
嗯,这个合规意识挺好的,我们做产品也得考虑这些。诶那个TTS怎么样?之前AI语音都很机械。
现在完全不一样了。端到端神经网络合成,能捕捉语调、节奏、情感。Flash版低延迟适合实时对话,Pro版音质好适合播客有声书。不是那种机器人味儿了。
等等,所以理论上我可以用它来做我们播客的配音?
你要失业了哈哈。
滚!那还有什么隐藏功能是大多数人不知道的?
几个我觉得特别实用的。第一,上下文缓存。你反复查同一份大文档,不用每次都重新付token费用,缓存后成本降80%以上。做RAG的企业用这个能省一大笔。
第二,屏幕共享分析。你共享屏幕让Gemini实时看你的界面,给UI反馈、做代码审查、分析竞品网站。相当于一个专家在你身后看着屏幕。
这个厉害……我做竞品分析的时候可以直接开着它边看边问。
对,还有文件上传限制提到了100MB,支持整个文件夹。批量分析100份客户反馈、提取多张发票数据,秒级完成。
我突然觉得这东西的变现空间很大啊。你想,帮客户做定制分析工具、内容批量转化、垂直行业研究……
你反应很快。而且它支持一键部署到Cloud Run,就是Google的无服务器平台,没流量不花钱,有流量自动扩容。你用Vibe Coding做的应用可以直接变成生产级Web服务,带域名带HTTPS。
从自然语言描述到上线一个SaaS产品,中间不需要懂Docker、K8s这些?
不需要。这就是门槛降低的意义。以前从原型到产品中间隔着一道巨大的工程化鸿沟,现在这道沟被填平了。
我在想,这对我们这种产品经理来说,其实是个能力边界的扩展。以前得等开发排期,现在自己就能把想法落地验证。
嗯,而且是免费的。你想想,Gemini 3.1 Pro、VO3、图像生成、TTS、Vibe Coding加一键部署,这套东西如果分开买订阅得多少钱。Google直接全给你了。
所以你的建议是,现在就去上手?
对,aistudio.google.com,浏览器直接打开。先用Flash模型探索,找到感觉了用Pro出结果。最重要的是动手做一个东西,哪怕最简单的工具,你就能感受到Vibe Coding的威力了。
行,我今晚就去试。回头做出来了发你看看,你帮我把把关。
没问题。不过我赌你做出来之后会跟我说'早该用了'。
哈哈好,那咱们下次聊的时候我带着作品来。