播客频道 | 4款免费AI视频生成工具评测：Grok/豆包/即梦/Google AI Studio使用教程

哎李博，你最近是不是又在折腾AI视频了？我看你朋友圈发了个变形金刚变汽车的视频，差点以为你转行做特效了。哈哈被你发现了。那个其实是用即梦的首尾帧功能做的，免费的，零成本。免费？我最近也想给我们产品做一些AI视频的demo，但市面上工具太多了，根本不知道选哪个。你能不能给我捋一捋？行，我最近刚好把主流的免费工具都试了一遍。Grok、Google AI Studio、豆包、即梦，这四个是目前真正能用且免费的。那先说Grok吧，马斯克那个。我之前只知道它能聊天，还能生成视频？对，它底层用的是自研的Aurora模型。你上传一张图片，它就能给你转成视频。操作特别简单，谷歌账号登录就行。但它最牛的一点是——生成的视频自带音效和背景音乐。等等，自带音效？就是说我不用再去找素材配音了？对！它是音视频端到端一体化生成的。你想想别的工具都是输出无声画面，你还得自己去剪辑软件里加音频。Grok直接省了这步。这对我们做产品demo太友好了。那它还有个什么Fun模式？ Fun模式就是会加夸张动作，比如你传个人物照片，它可能让角色上来就翻个跟头。本质上是放大了运动参数的随机性。Normal模式就正常遵循物理规律。哈哈那Fun模式适合做表情包素材。你们产品经理脑子就是活。那Google AI Studio呢？听着很专业的样子。这个确实偏专业。它用的是VEO引擎，Google DeepMind团队做的，基于扩散模型架构。你可以理解为从一堆噪点出发，一步步去噪还原出清晰的视频帧。参数能调吗？比如时长、比例这些。能，比例支持横屏竖屏，时长可以选5到8秒。但有个致命问题——每个账号只有10个免费额度。才10个？！对，而且分辨率只有720p。所以我觉得它更适合做概念验证，确认创意方向，不适合量产。懂了懂了，就是拿来试试效果的。那说说豆包吧，这个我同事天天用。豆包对国内用户最友好，抖音账号直接登录，不用翻墙。每天10次免费额度，而且它支持21:9的电影宽银幕比例，生成出来那个质感真的很棒。 21:9？就是那种电影院的画面比例？对，院线电影常用的。我测了一张骑马的图，生成出来马匹奔跑、尘土飞扬，物理运动模拟得非常到位。但每天才10次感觉不太够用啊，调参数试几次就没了。所以重点来了——即梦，每天60到100积分，生成一个视频才5积分。算下来每天能做12到20个视频。一天二十个？这也太大方了吧。而且功能是这四个里最全的。首尾帧、补帧、AI音效、对口型，全都免费。等会儿让我想想，首尾帧是什么意思？就是我给个开头画面和结尾画面，中间它自己补？对！你可以类比传统动画的关键帧概念。主画师画第一帧和最后一帧，中间的过渡由AI自动推算。核心难点在于AI要理解两张图之间的语义关系，不是简单做图片融合。所以你那个变形金刚变汽车就是这么做的？没错，首帧放变形金刚，尾帧放卡车，提示词写变形过程，五秒钟的视频效果相当惊艳。这不就是穷人版特效工作室吗！哈哈差不多这意思。而且它还有补帧功能，默认24fps可以升到60fps。 60帧那就很丝滑了，做慢动作也不会卡。你还挺懂嘛。得了吧，这个我们做短视频产品的时候天天打交道。那你最终推荐哪个？如果长期做视频创作，即梦无悬念。额度够、功能全、迭代快。需要自带音效就用Grok补充。豆包适合国内用户快速体验，Google AI Studio就留着做专业测试。其实我觉得挺感慨的，去年这时候这些工具要么不存在要么还收费，现在免费就能做到这种程度了。嗯，而且现在行业在往DiT架构发展，就是把扩散模型和Transformer融合。画质和时序一致性都在快速提升，预计明年免费工具分辨率就能上1080p了。好，那我今天回去就把即梦下了，先拿我们产品的demo试试。回头效果好了请你喝咖啡。行，记得首尾帧功能多玩玩，那个真的会上瘾。

4款免费AI视频生成工具评测：Grok/豆包/即梦/Google AI Studio使用教程

更多播客

AI热点风向标·06月07日午间版

AI热点风向标·06月07日早间版

每日AI新鲜事·06月07日早间播报