AI第一人称情绪短片制作全流程：从剧本到成片四步搞定

为什么第一人称AI短片能成为爆款

最近刷遍全网的第一人称AI真人告别短片，凭借极强的代入感和情绪张力，让无数观众看一条哭一条。这类短片的核心优势在于：第一人称视角天然拉近与观众的距离，配合AI生成的写实画面和精心设计的眨眼转场，营造出"一眨眼就是一段人生"的宿命感。

但很多创作者卡在了起步阶段——不知道剧本怎么写、提示词怎么构造、视频生成后如何剪辑成片。今天我们把整个制作流程拆解为四个核心步骤：剧本脚本创作、文生视频提示词撰写、AI视频生成、后期剪辑成片，新手照着做就能产出完整作品。

bilibili source

第一步：用AI生成原创剧本

两种剧本获取方式

获取剧本有两条路径：一是从番茄小说等网文平台改编现有故事，优点是故事成熟、情绪饱满，但存在版权风险，新手不建议直接使用；二是用AI大语言模型直接生成原创剧本，零成本且完全规避版权问题。

提示词模板直接套用

推荐使用以下提示词框架（可根据题材替换关键词）：

你是一位拥有千万粉丝的情绪短视频金牌编导，同时也是真人写实AI视频视觉逻辑的导演。请你以「亲情告别」为核心主题，写出5个不同故事剧本，仅需要故事梗概，不需要分镜脚本。要求每个故事都有极强的生活烟火气和情绪张力，情节有细节有戳点，能引发观众的深度共鸣。

想要视频有共鸣

这里有两个关键细节：

开头的身份设定是为了给AI定调性。想做古风短片就改成"古风短剧金牌编剧"，想做悬疑就换成对应身份
结尾标注"只要故事梗概，不要分镜脚本"，避免AI输出大量无关内容，现阶段只需要创意和故事线

生成后如果不满意，可以追加优化指令，比如要求"更换不同情绪内核，涵盖亲情、成长、遗憾、和解等主题"，直到选出最有画面感的故事。

第二步：构造精准的文生视频提示词

90%新手在AI视频生成时遇到画面跑偏、视角错乱、风格不统一的问题，根源几乎都出在提示词上。提示词的核心构造分为两大块，缺一不可。

单片段画面提示词

把剧本里的每个片段逐一套进模板，让AI精准生成对应的画面。每条提示词需要包含：时长、画面描述、台词内容、情绪氛围。提示词越精准，生成效果越好。

提示词撰写核心步骤

有意思的是，由于我们做的是第一人称视角，每个片段的场景和人物都不一样，不需要提前生成人物设定图。直接用文字提示词生成，反而更能保证每个阶段的年龄感和场景感贴合故事。另外一个现实原因是：生成的人物设计图有很大概率过不了平台审核。

全局统一约束提示词（重中之重）

这是保证所有片段视角统一、风格一致的核心，必须粘贴在每一条提示词的末尾：

全程第一人称视角，头部自然轻微晃动，一镜到底没有切近，无镜头推拉运镜；全程贯穿粗糙数码录像感，带自然画面噪点，轻微对焦对不准，自然杂乱的环境光线；全程没有背景音乐，没有字幕，没有水印，保留真实环境音和人物对话声。

很多人反馈生成视频时变成第三人称、画面太精致没有代入感、看起来"很AI"，都是因为缺少这段全局约束。把这段话当作"保险条款"，每条提示词末尾都要带上。

第三步：AI视频生成与问题排查

提示词准备好后，将内容发送给AI视频生成工具（如CDES 2.0），注意选择16:9横版格式。生成后需要逐一检查每个片段，常见问题及解决方案如下：

检查生成视频质量

问题类型	解决方法
台词错误/多字漏字	修改提示词中的台词内容，精准到每一个字，重新生成
动作不符合预期	细化动作描述，如将"女主转头"改为"女主缓缓转头看向左侧"
视角变成第三人称	检查全局约束提示词是否粘贴完整，确认无误后重新生成
画面穿模/场景畸形	在负面提示词中补充"画面畸形、空间错乱"等，同时细化场景描述

每个片段都按这个方法反复迭代到满意效果后，逐一下载保存。

第四步：剪映剪辑成片的五个关键环节

剪辑推荐使用剪映（电脑端和手机端操作逻辑一致），整个后期流程分为五个环节：

1. 素材导入与排序

将所有生成好的片段素材导入剪映，按情节顺序依次拖入时间轴。

2. 添加灵魂转场——眨眼效果

这是整个短片最核心的剪辑技巧。点击左上角"转场"，搜索"眨眼"，将转场效果拖到两个片段的衔接处。建议时长设置为0.8-1秒，这是最符合人眼自然眨眼节奏的时长，能完美实现年龄和场景的无缝切换，营造出"一眨眼就是一辈子"的效果。

3. 添加字幕

字幕添加操作

点击"文本"→"默认文本"，拖到时间轴上与人物说话时长对齐。字体选择清晰有质感的黑体或圆体，避免花哨字体抢戏。可以给字幕加轻微阴影并适当降低透明度，保证在任何画面上都清晰可读。第一个字幕格式调好后直接复制粘贴，后续只需修改文字内容即可统一全篇格式。

4. 配乐选择

音乐是情绪短片的第二灵魂。在剪映音乐库中搜索贴合故事情绪的纯音乐（避免有歌词的音乐抢台词风头），拖入音乐轨道后裁剪到与视频等长。关键细节：将背景音乐音量调小，确保人物台词清晰为主，音乐只做情绪铺垫。

5. 预览与导出

所有内容调整完毕后完整预览一遍，确认节奏、字幕、音画同步无误，点击右上角导出即可。

总结：流程标准化才是降低门槛的关键

从这个完整流程可以看出，AI情绪短片的制作并不需要复杂的技术背景。真正的核心竞争力在于三点：选对有情绪张力的故事、写出精准的提示词（尤其是全局约束）、掌握眨眼转场等剪辑技巧。

随着各大厂商不断推出更强的AI视频生成工具，操作门槛只会越来越低。但工具的易用性提升，也意味着内容质量和创意差异化将成为真正的护城河。与其焦虑于工具迭代，不如先用现有工具完成第一个作品——做出来，比什么都重要。