最近我被一个东西刷屏了——Google出了个免费的AI IDE叫AntiGravity,然后有人给它做了个插件,装上之后据说能一句话生成视频、播客,甚至直接把电商网站部署上线。我第一反应是,这也太夸张了吧?
哈哈,我第一次看到的时候也是这个反应。但我实际试了一下,怎么说呢,它确实做到了,虽然质量上还有讨论空间,但整个流程的完整度是真的让人惊讶。
那我们先把背景交代一下。AntiGravity本身是Google推出的一个AI集成开发环境,内置了Gemini 2.5 Pro,也就是Google目前最强的大模型。它属于AI IDE这个赛道,跟Cursor、Windsurf这些是竞品关系。
对,AI IDE这个品类最近两年特别火,核心理念就是你不用一行一行敲代码了,跟AI聊天就能写程序。AntiGravity的特别之处在于它完全免费,而且Gemini 2.5 Pro的推理成本是Google自己兜底的。你想想,这个模型支持100万token的上下文窗口,代码生成能力在各种基准测试里排名都很靠前,这个算力白送给你用,Google的意图很明显——用补贴换开发者生态,跟当年Android的打法一模一样。
嗯,免费的IDE加免费的大模型,这已经很有吸引力了。但你说真正让它脱胎换骨的是那个叫SkillBoss的插件?
没错。SkillBoss大概15美元,一次性购买。它本质上是一个zip压缩包,安装方式特别简单,就是在AntiGravity的聊天窗口里上传这个文件然后执行安装命令,系统自动解压配置。装完之后你的项目目录里会多出一大堆东西——脚本、模板、工作流,还有一个叫Remotion的视频框架。
等等,Remotion是什么?
Remotion是一个基于React的程序化视频生成框架。简单说就是,你用写React组件的方式来创建视频,每一帧画面其实都是一个React组件的渲染结果。这在AI场景下特别有价值,因为AI本来就擅长生成代码嘛,它直接生成React代码描述视频内容,然后Remotion负责渲染成最终的视频文件,完全绕开了传统视频编辑软件那套复杂操作。
这个思路挺巧妙的。那SkillBoss装完之后到底能干什么?我看它的能力清单还挺长的。
其实可以分三大块来看。第一块是多媒体生成,包括AI视频、图片、播客音频,甚至还能通过Gamma集成做演示文稿。第二块是全栈开发和部署,支持网站部署到Cloudflare、集成Google OAuth登录、接Stripe支付、管理数据库。第三块是自动化工具,像邮件发送、网页抓取这些。
听起来像是把十几个不同的SaaS工具塞进了一个包里。
你这个比喻很准确!其实这正是SkillBoss最大的价值所在。以前你要生成音频得去注册ElevenLabs拿API Key,生成视频要去fal.ai拿另一个Key,抓网页数据要配Firecrawl,每个工具都要单独注册、单独写集成代码,整个过程非常零散。SkillBoss把这些全部整合了,一次配置就能调用所有功能。
好,说到实际效果,我最好奇的是那个一条指令同时生成三种内容的演示。
对,测试用的提示词大概是这样的:创建一个龙在天空飞翔的视频、一只猫吃三明治的图片、以及一期关于2026年AI Agent的播客。就这么一句话。AntiGravity拿到之后,先去分析skill.md文件确认自己能干什么,然后制定计划,接着并行启动三个任务,实时显示进度。最终你会得到一段带背景音乐的龙飞行视频、一张猫与三明治的图片,还有一期完整的播客音频。
几分钟之内?
对,几分钟。而且所有文件都保存在项目目录里,还给你生成在线预览链接。
那电商网站那个演示呢?我觉得那个更能说明问题。
电商网站的演示更震撼。输入就一句话——用SkillBoss为我的猫粮网站构建一个电商网站。然后AI自动开始产品策划,生成产品创意、描述、定价方案,接着调用AI生成每个产品的展示图,再编写前端页面组件,最后通过Cloudflare Workers部署上线。
Cloudflare Workers我知道,边缘计算平台,全球三百多个节点,冷启动五毫秒以内。用它部署确实快。
对,SkillBoss选它就是看中了零配置、秒级上线这个特性。最终生成的网站有产品图片、产品描述、交互按钮,是一个完整的电商页面。当然,说实话这只是个基础版本,距离真正能上线卖货还有差距。但后续可以接入Stripe支付、加更多产品页面来完善。
你提到Stripe,这个集成复杂吗?
传统方式的话,一个独立开发者从零实现生产级的Stripe集成,通常要花几天到几周。因为涉及Webhook配置、PCI DSS安全合规、订阅管理、退款处理这些环节。SkillBoss的做法是把这些最佳实践封装成模板,AI可以直接调用,相当于把几周的活压缩到几分钟。
本质上就是AI版的Shopify了。那我们聊聊底层原理吧,SkillBoss到底是怎么让AI变强的?
这个问题问得好。SkillBoss其实不是传统意义上的插件,它更像是一套技能描述文件加预配置模板的组合。核心是那个skill.md文件,它充当AI的能力说明书,告诉Gemini你现在能做什么、怎么做。当这个文件被加载到Gemini的上下文窗口里,模型就把里面描述的能力和API调用方式当作即时知识来使用,不需要任何微调或重新训练。
所以本质上是利用了大模型的上下文学习能力?
完全正确。它跟System Prompt工程和RAG有相似之处,但更进一步——不仅提供知识,还提供了可执行的模板和脚本路径。而且这种模式有一个很大的优势就是可组合性,不同的技能包可以叠加使用,理论上能无限扩展AI Agent的能力范围。这暗示了AI IDE未来一个重要方向:通过标准化的技能包来扩展AI的能力边界,而不是依赖硬编码的插件接口。
嗯,这个方向确实很有想象空间。不过我们也得说说局限性,总不能全是好话。
当然。第一,生成质量有天花板,视频和图片的质量取决于底层模型,目前跟专业工具比还有差距。第二,电商网站偏基础,能快速搭建但离生产级别还远。第三,整个流程依赖Google的免费API额度,大规模使用可能会受限。
所以总结一下,15美元买个技能包,加上免费的IDE和免费的Gemini 2.5 Pro,你就有了一个能生成视频、做播客、部署网站的全栈开发环境。对个人开发者和小团队来说,这个性价比确实很难找到对手了。
我觉得更值得关注的其实不是这个具体产品,而是它代表的趋势——AI Agent通过技能注入的方式不断扩展能力边界。今天是15美元解锁多媒体生成和电商部署,明天可能就是更多垂直领域的技能包涌现出来。这个生态一旦跑起来,想象空间是非常大的。
说得好。对这个方向感兴趣的朋友可以去试试,毕竟门槛真的很低,15美元的试错成本,值得一玩。