Coze工作流搭建教程:一键生成历史短视频完整实操

用Coze工作流自动生成历史故事短视频的完整教程
本文详细介绍了如何利用字节跳动的Coze(扣子)AI工作流平台,通过六大模块实现历史故事短视频的自动化生产。只需输入一个历史主题关键词,系统即可自动完成文案生成、主角图像生成与抠图、主题提取、分镜与字幕生成、语音合成及剪映草稿输出,2-3分钟生成完整视频,大幅降低了传统短视频制作的时间和技术门槛。
历史故事类短视频一直是各大平台的流量密码,但传统制作流程涉及文案撰写、配音录制、分镜绘制、视频剪辑等多个环节,做一条高质量的历史短视频往往要花上数小时甚至好几天。现在借助 Coze(扣子)工作流,我们可以把这些环节串联起来实现自动化——只需输入一个历史主题(比如"玄武门之变"),2-3 分钟就能生成一条完整的沉浸式历史故事短视频。
Coze(扣子)是字节跳动推出的 AI 应用开发平台,允许用户通过可视化拖拽方式将大模型、插件、数据库等能力组合成自动化工作流,无需编写复杂代码即可构建 AI 应用。其工作流本质上是一种 DAG(有向无环图)编排系统,每个节点代表一个处理单元,节点之间通过变量传递数据。这种低代码范式大幅降低了 AI 能力集成的门槛,使内容创作者也能构建复杂的多模态自动化流水线。
这篇教程会完整拆解这套 Coze 工作流的搭建逻辑和每个节点的配置细节,帮你从零复刻整个流程。
Coze工作流整体架构:一个输入,六大模块
整套工作流的核心思路可以概括为 "一个输入,六大模块":
- 输入:用户提供一个历史主题关键词
- 模块一:大模型生成视频口播文案
- 模块二:大模型生成主角图片提示词 + 图像生成 + 抠图
- 模块三:大模型提取两字主题
- 模块四:大模型生成分镜字幕与分镜图像提示词
- 模块五:批处理生成分镜图像 + 语音合成 + 音频时长获取
- 模块六:数据整合 + 剪映草稿生成(含关键帧、字幕、标题、背景音乐等)
最终输出一个剪映草稿链接,导入剪映就能预览和导出完整视频。

模块一:用DeepSeek V3生成视频口播文案
配置开始节点
在 Coze 工作空间的资源库中新建一个工作流。开始节点需要配置一个输入变量,也就是用户输入的历史主题(比如"玄武门之变")。
大模型节点的提示词设计
添加第一个大模型节点,命名为"生成视频文案",模型选择 DeepSeek V3。
DeepSeek V3 是深度求索公司发布的大语言模型,采用 MoE(混合专家)架构,拥有 6710 亿参数但每次推理仅激活 370 亿参数,在保持高性能的同时大幅降低推理成本。在多项基准测试中,DeepSeek V3 的代码生成、数学推理和中文理解能力与 GPT-4o、Claude 3.5 Sonnet 处于同一梯队,但 API 调用价格仅为同类模型的十分之一左右,这使其成为需要大量调用大模型的自动化工作流场景下性价比最高的选择之一。
系统提示词的核心结构包含五个要求:
- 悬念开场:制造悬念,第一时间抓住观众注意力
- 身份代入:让观众以第一/第二人称代入历史人物
- 冲突升级:层层推进,拉满剧情紧张感
- 破局细节:关键转折处加入细节描写
- 主题收尾:升华主题,引发观众思考
提示词中还附带了三个参考文案示例,并明确要求:每段不超过三句话、多用短句制造紧张节奏、加入至少两处历史专业术语、在关键转折点使用感官描述。正式生成时要求约 1000 字,测试阶段可以缩减到 200-300 字来节省 API 调用资源。
输出格式设为 JSON,变量名改为 content。
模块二:AI生成主角图像并自动抠图
大模型生成绘画提示词
添加第二个大模型节点,同样选择 DeepSeek V3。输入引用上一步的 content 变量,系统提示词要求根据故事信息生成主角的开场绘画提示词,包含角色定位、技能描述和限制条件。
图像生成节点配置
添加"图像生成"节点,具体配置如下:
- 模型:通用 Pro
- 比例:4:3
- 生成质量:拉到最大
- 正向提示词:引用上一步生成的绘画提示词
图像生成节点底层通常基于扩散模型(Diffusion Model),通过正向提示词(Positive Prompt)引导模型生成符合描述的图像。提示词的质量直接决定图像的风格一致性和画面细节,因此在上一步专门用大模型来生成结构化的绘画提示词,而不是直接把文案原文传入图像生成节点。
抠图节点处理
添加抠图节点,把生成的主角图片传入,保持默认参数即可。抠图节点依赖语义分割模型(如 SAM、U²-Net 等),能够自动识别图像中的主体对象并去除背景,输出带透明通道的 PNG 图像。在视频制作场景中,抠图后的主角图像可以叠加在任意背景上,实现"人物浮层"效果,这是短视频开场画面中常见的视觉设计手法,也是后续在视频开场画面中叠加主角形象的关键准备步骤。

模块三:提取两字主题用于视频标题展示
这个节点的任务很简单:从生成的文案中提炼出精准的两个字主题(比如"夺权""兵变
相关推荐
教程攻略Cursor+Codex双IDE协同:开源项目二开实战方法论
基于实战经验总结的开源项目二次开发完整方法论,详解Cursor+Codex双IDE协同工作流,涵盖二开七环节、MVP验证、AI读源码技巧,帮助开发者三天跑通项目、两周完成业务集成。
教程攻略Cursor多Agent实战:50分钟搭建Next.js全栈博客
使用Cursor IDE多Agent协作模式,50分钟内从零搭建全栈博客。涵盖Next.js、Clerk认证、Supabase数据库集成,详解4个AI Agent分阶段开发流程与关键避坑经验。
教程攻略从零搭建AI软件工厂:Cursor工程师的多Agent协作实战经验
Cursor工程师Eric分享AI软件工厂构建实战:从自动化六层级、护栏设计、并行Agent管理到规模化扩展,详解如何用多Agent协作实现7×24小时高效软件开发。