哎李博,你最近是不是又在折腾AI视频了?我看你朋友圈发了个变形金刚变汽车的视频,差点以为你转行做特效了。
哈哈被你发现了。那个其实是用即梦的首尾帧功能做的,免费的,零成本。
免费?我最近也想给我们产品做一些AI视频的demo,但市面上工具太多了,根本不知道选哪个。你能不能给我捋一捋?
行,我最近刚好把主流的免费工具都试了一遍。Grok、Google AI Studio、豆包、即梦,这四个是目前真正能用且免费的。
那先说Grok吧,马斯克那个。我之前只知道它能聊天,还能生成视频?
对,它底层用的是自研的Aurora模型。你上传一张图片,它就能给你转成视频。操作特别简单,谷歌账号登录就行。
但它最牛的一点是——生成的视频自带音效和背景音乐。
等等,自带音效?就是说我不用再去找素材配音了?
对!它是音视频端到端一体化生成的。你想想别的工具都是输出无声画面,你还得自己去剪辑软件里加音频。Grok直接省了这步。
这对我们做产品demo太友好了。那它还有个什么Fun模式?
Fun模式就是会加夸张动作,比如你传个人物照片,它可能让角色上来就翻个跟头。本质上是放大了运动参数的随机性。Normal模式就正常遵循物理规律。
哈哈那Fun模式适合做表情包素材。
你们产品经理脑子就是活。
那Google AI Studio呢?听着很专业的样子。
这个确实偏专业。它用的是VEO引擎,Google DeepMind团队做的,基于扩散模型架构。你可以理解为从一堆噪点出发,一步步去噪还原出清晰的视频帧。
参数能调吗?比如时长、比例这些。
能,比例支持横屏竖屏,时长可以选5到8秒。但有个致命问题——每个账号只有10个免费额度。
才10个?!
对,而且分辨率只有720p。所以我觉得它更适合做概念验证,确认创意方向,不适合量产。
懂了懂了,就是拿来试试效果的。那说说豆包吧,这个我同事天天用。
豆包对国内用户最友好,抖音账号直接登录,不用翻墙。每天10次免费额度,而且它支持21:9的电影宽银幕比例,生成出来那个质感真的很棒。
21:9?就是那种电影院的画面比例?
对,院线电影常用的。我测了一张骑马的图,生成出来马匹奔跑、尘土飞扬,物理运动模拟得非常到位。
但每天才10次感觉不太够用啊,调参数试几次就没了。
所以重点来了——即梦,每天60到100积分,生成一个视频才5积分。算下来每天能做12到20个视频。
一天二十个?这也太大方了吧。
而且功能是这四个里最全的。首尾帧、补帧、AI音效、对口型,全都免费。
等会儿让我想想,首尾帧是什么意思?就是我给个开头画面和结尾画面,中间它自己补?
对!你可以类比传统动画的关键帧概念。主画师画第一帧和最后一帧,中间的过渡由AI自动推算。核心难点在于AI要理解两张图之间的语义关系,不是简单做图片融合。
所以你那个变形金刚变汽车就是这么做的?
没错,首帧放变形金刚,尾帧放卡车,提示词写变形过程,五秒钟的视频效果相当惊艳。
这不就是穷人版特效工作室吗!
哈哈差不多这意思。而且它还有补帧功能,默认24fps可以升到60fps。
60帧那就很丝滑了,做慢动作也不会卡。
你还挺懂嘛。
得了吧,这个我们做短视频产品的时候天天打交道。那你最终推荐哪个?
如果长期做视频创作,即梦无悬念。额度够、功能全、迭代快。需要自带音效就用Grok补充。豆包适合国内用户快速体验,Google AI Studio就留着做专业测试。
其实我觉得挺感慨的,去年这时候这些工具要么不存在要么还收费,现在免费就能做到这种程度了。
嗯,而且现在行业在往DiT架构发展,就是把扩散模型和Transformer融合。画质和时序一致性都在快速提升,预计明年免费工具分辨率就能上1080p了。
好,那我今天回去就把即梦下了,先拿我们产品的demo试试。回头效果好了请你喝咖啡。
行,记得首尾帧功能多玩玩,那个真的会上瘾。