播客频道 | 即梦Seedance 2.0使用教程：省钱技巧+提示词实操全解析

最近刷社交媒体，你一定看到了各种AI生成的短视频满天飞，什么换脸的、翻唱的、漫画变动画的——背后很大一部分都来自字节跳动刚发布的Seedance 2.0。今天我们就来好好聊聊这个模型，到底强在哪，怎么用，以及怎么省钱。请到的嘉宾是一直在跟踪AI视频生成领域的技术专家。先给大家一个直观感受吧，这个2.0版本到底升级了什么？最大的升级其实就一句话：它支持最多9张图片加3个视频同时作为参考输入。你想想，之前的AI视频生成基本就是给一段文字或者一张图，模型帮你生成视频，输入非常单一。但Seedance 2.0可以同时吃进去图片和视频，总共最多12个文件，然后你在提示词里用@素材名的方式告诉模型，这张图是干嘛的，那段视频是干嘛的，模型就能理解你的复杂意图。等等，这个@素材名的机制挺有意思的，有点像我们在社交媒体上@别人？对，你可以这么理解。比如你上传了一张人物照片、一张场景图、一段舞蹈视频，你在提示词里写'以@图一的人物为主角，在@图二的场景中，参考@视频一的舞蹈动作'，模型就知道每个素材该怎么用了。这里有个特别重要的坑——每张上传的素材都必须被@引用。实测发现，如果你上传了一张图但没在提示词里提到它，模型就会'懵'，把那张图随机插进生成结果里好几次，效果直接崩掉。这算是最常见的翻车原因了吧。那从技术角度讲，它是怎么做到同时理解图片和视频这两种完全不同的输入的？嗯，这个确实是技术上的硬活。它的底层大概率是基于视频扩散模型，就是从Stable Diffusion那一脉发展过来的。简单打个比方，扩散模型的原理就像是你把一杯墨水倒进清水里，水慢慢变浑浊，这是加噪声的过程。然后模型要学会的是反过来——从浑浊的水里把墨水'抽'回去，恢复成清水。从图像扩散到视频扩散，最大的挑战是多了时间维度，模型不光要让每一帧好看，还要保证帧与帧之间是连贯的，人不能上一秒长这样下一秒就变脸了。而Seedance 2.0更进一步，它要同时理解静态图片的空间信息和动态视频的时序信息，然后融合到一个统一的生成空间里。这背后是字节在多模态大模型上的长期积累。明白了。那我们来聊聊大家最关心的——钱的问题。我看到平台有个1元体验7天会员的活动，听起来挺划算？哈，这恰恰是个坑！你看，平台给首次充值的用户有个很大的折扣，连续包年五折、连续包月六折。但问题是，你一旦用了那个1元体验活动，系统就认为你已经充过值了，首充折扣就没了。一块钱买了200积分，但可能亏掉了几百块的折扣。所以正确的操作是？更聪明的做法是拿一个账号花1块钱先体验，确认这个工具确实适合自己，然后换一个新账号直接买高级会员，299一个月送15000积分，享受首充折扣。另外还有个薅羊毛的路子——Seedance 2.0目前在三个平台都能用：即梦官网、剪映小云雀和豆包。小云雀注册就送130积分，不用花钱就能试。而且即梦和小云雀都有邀请活动，每邀请一个人注册送188积分，每天上限3人，两个平台加起来理论上每天能拿1128积分。这羊毛薅得挺狠的。好，我们进入实操环节。你觉得Seedance 2.0最实用的几个场景是什么？我总结了四个核心场景。第一个是首尾帧加动作参考的组合，这是最基础也最实用的。你上传一张图作为视频的第一帧，再上传一张图作为最后一帧，模型自动生成中间的过渡画面，同时你还可以附加一段参考视频来控制动作。比如你想做一个打斗场景，首帧是人物站立，尾帧是倒地的场景，参考视频是一段武术动作，模型就能把这些信息组合起来生成一段完整的打斗视频。这个首尾帧插值的思路其实不新，但用扩散模型来做和传统方法有什么区别？区别很大。传统的帧插值依赖光流估计，本质上是在像素层面算运动轨迹，遇到遮挡或者大幅度运动就容易出问题。但扩散模型是在潜空间里学习语义级别的运动，它理解的不是'这个像素往哪移'，而是'这个人从站着变成倒下'这个语义变化，所以生成的过渡自然得多。第二个场景呢？视频延长和视频融合。延长很简单，上传一段视频写'延长5秒'就行，最长能到15秒。融合更有意思，你上传两段视频，用提示词描述中间的过渡，模型自动生成衔接内容。这对剪辑工作流来说太实用了，素材不够的时候AI帮你补。第三个场景是人物替换，这也是现在短视频平台上最火的玩法——找一段热门视频当动作参考，把主角换成你想要的人物。模型在人物一致性上做得很好，不同角度不同光照下人脸不会变形。但这个人物替换的玩法，是不是也带来了一些问题？我看到你提到了监管风险。对，这是个很现实的问题。太多人拿这个功能做恶搞真人视频，监管部门已经介入了。其实中国2023年就实施了《生成式人工智能服务管理暂行办法》，明确要求不能侵犯肖像权，生成内容要加标识。深度伪造技术的滥用是全球性问题，字节作为平台方必须在技术开放性和合规性之间找平衡。目前真人视频生成功能可能会被进一步收紧，这一点大家要有心理准备。第四个场景是漫画转视频？对，这个场景特别有想象力。你可以直接上传漫画截图或者小说片段，模型根据内容生成视频。更高级的玩法是用JSON格式的提示词，精确控制第几秒到第几秒展示什么画面。这就像写分镜脚本一样，比自然语言描述精确得多。自然语言说'先展示A再切到B'，这个'先'和'再'到底是几秒，模型只能猜。但JSON格式可以写死时间戳，模型执行起来准确率高很多。最后给想上手的听众几个实用建议吧。四点。第一，每张素材必须@引用，这是最重要的，前面说过了。第二，多人物场景一定要提供一张全景参考图，把所有人物的相对位置关系交代清楚，不然前几帧人物位置会很混乱。第三，复杂场景别贪长，分段生成再用融合功能拼接，效果比一次性生成长视频好得多。第四，对时间线有精确要求的时候，果断上JSON提示词。总结一下，Seedance 2.0确实是目前AI视频生成的一个标杆级产品，多图多视频联合参考这个能力打开了很多新玩法。但也要注意省钱策略别踩1元体验的坑，真人视频生成要注意合规风险。建议大家从简单的单图生成开始，慢慢摸索出自己的工作流。嗯，而且这个模型还在灰度测试阶段，后面肯定还会继续迭代。现在是上手摸索的好时机，等全量开放竞争就激烈了。早玩早有经验优势。

即梦Seedance 2.0使用教程：省钱技巧+提示词实操全解析

更多播客

AI热点风向标·06月07日午间版

AI热点风向标·06月07日早间版

每日AI新鲜事·06月07日早间播报