游戏小白用AI做RPG:《今天也没飞升》全流程AI生成实践

游戏小白借助AI工具独立开发2D ARPG游戏Demo,展示AI在游戏开发中的潜力与局限。
一位自称"游戏小白"的创作者利用多种AI工具独立完成了修仙题材2D ARPG《今天也没飞升》的Demo开发。项目展示了AI在场景生成与智能分层、逐帧动画生成、LLM驱动的动态表情对话等环节的深度应用,证明AI不仅能降低游戏开发入门门槛,还能实现流程自动化,同时也暴露了帧间一致性等技术局限。
一位自称"游戏小白"的创作者,借助多种AI工具,独立完成了一款2D ARPG游戏《今天也没飞升》的Demo开发。从场景生成到角色表情,再到动态对话系统,这个项目展示了AI在独立游戏开发中的巨大潜力,也暴露了当前技术的真实局限。
游戏概览:修仙题材的类幸存者ARPG
《今天也没飞升》是一款2D俯视角ARPG游戏,当前版本为v0.0.1。故事讲述主角陆行舟在小村里每天做着飞升大梦,力所能及地为村里除妖捉鬼,直到遇见一位无名乞丐并获得奇怪道具,从此踏上天高海阔的旅程——人妖两利,正邪界限不再清晰。

游戏主打"类幸存者+阵甲ARPG"的玩法组合,以剧情推进为核心驱动力。「类幸存者」这一子类型起源于2020年发布的独立游戏《吸血鬼幸存者》(Vampire Survivors)——该游戏以极简操作(角色自动攻击,玩家只需控制移动)、随机技能成长和高强度的弹幕式战斗为核心,在全球范围内引发了大量模仿作品。其核心设计哲学是「Build构建」:玩家在每局游戏中通过随机选择技能和升级路径,形成独特的角色配置,每局体验因此各不相同。将这种快节奏随机战斗与传统RPG线性叙事相结合,意味着开发者需要在两种截然不同的节奏感之间找到平衡点——这本身就是一个非平凡的设计挑战,出自一位"游戏小白"之手,更显得难能可贵。
五行技能系统:简洁而有深度的设计
游戏的技能内核以金、木、水、火、土五行为基础,在此之上进一步衍生出六种进阶元素,构建了一套层次分明的技能体系。技能分为主动技能和被动技能两大类,玩家需要将它们分别装备在两种有限的技能槽中才能使用。

有限技能槽的设计是一个聪明的选择——它迫使玩家在丰富的技能池中做出取舍,每次出战前的Build构建本身就成为了一种策略博弈。这种"少即是多"的设计哲学,与类幸存者游戏中随机获取技能的机制形成了有趣的互补:随机性带来惊喜,而有限的槽位则带来取舍的张力。
AI全流程生成:场景、动画与角色表情
这个项目最值得关注的,是AI技术在游戏开发各环节的深度应用。
场景生成与智能分层
游戏场景采取近俯视视角,通过全AI生成的方式实现了分层提取与渲染。系统能够自动设置可行走区域、自动提取水面区域并实现水面特效等。
这背后的核心技术是图像语义分割(Semantic Segmentation)——AI模型能够识别图像中不同区域的语义类别(地面、水面、障碍物、建筑等),并自动生成对应的遮罩层(Mask Layer)。Meta发布的SAM(Segment Anything Model)等现代分割模型已经能够以极低的人工干预完成复杂场景的区域划分。将这一能力与游戏引擎的图层系统结合,就能实现「生成即可用」的场景素材流水线——开发者不再需要手动逐像素地标注碰撞体和特效区域,AI完成了大量繁琐的基础工作。

地图设计按照"世界大地图→区域地图→聚集场景"三层结构展开,共分为五个大区域,按顺时针方向难度递增。这种经典的开放世界分区设计,配合AI生成的场景素材,大幅降低了美术资源的生产门槛。
动画生成的诚实反思
在角色动画方面,开发者使用AI生成逐帧动画图,但坦诚地指出"目前尚存明显瑕疵"。他同时提出了一个有价值的技术判断:使用视频生成AI而非生图AI来制作动画,可能会获得更好的效果。
这一判断背后有深刻的技术原因。生图AI(如Stable Diffusion、Midjourney)在生成每一帧时是独立采样的,即便使用相同的提示词和种子,帧间的细节——角色面部特征、服装纹理、光影方向——都会产生细微偏差,累积后形成明显的「闪烁感」(Flickering)和角色不一致问题。视频生成模型(如Runway Gen-3、Kling)则在时序维度上建立了连贯性约束,模型在生成每一帧时会参考前后帧的状态,从而保证运动轨迹和视觉风格的连贯性。对于游戏精灵动画(Sprite Animation)这类需要严格帧间一致性的应用场景,视频生成模型的架构优势是本质性的,而非调参技巧能弥补的差距。
LLM驱动的动态表情对话
游戏使用AI生成了所有主角与NPC的丰富表情头像,并通过语言大模型(LLM)为每句台词自动匹配对应情绪的表情。

这个设计的巧妙之处在于:它不仅仅是用AI生成静态资源,而是让AI参与到运行时的动态决策中。在传统游戏开发中,角色表情切换依赖美术和策划手动为每句台词标注情绪标签,这是一项极其繁琐的工作,且难以覆盖动态生成的对话内容。而LLM的情感分析能力(Sentiment Analysis)可以理解台词的语境、语气和情感倾向,并从预设的表情库中实时选择最匹配的状态——技术实现上,通常是将台词文本发送给LLM,要求其返回结构化的情绪标签(如JSON格式),游戏引擎再根据标签切换对应的表情资源。这种「LLM作为运行时推理引擎」的模式,使得角色对话变得"活灵活现"。Demo中展示的即兴对话故事,证明了这套系统在实际运行中的可行性。
AI游戏开发的启示与局限
《今天也没飞升》作为一个v0.0.1的早期Demo,其完成度和设计思路已经超出了"游戏小白"的预期水准。它至少证明了几件事:
AI降低了游戏开发的入门门槛。 场景美术、角色立绘、表情系统等传统上需要专业美术团队的工作,现在一个人借助AI工具就能完成基本可用的版本。
AI的价值不仅在于生成资源,更在于自动化流程。 自动分层渲染、自动标注可行走区域、自动匹配表情——这些"自动化
相关推荐
产品体验Qoder vs Cursor实测对比:同样20美金谁更强?
实测对比Qoder和Cursor两款AI IDE,从Agent自主修复能力、人工沟通次数、架构决策等维度评测。Qoder仅需2次沟通完成任务,Cursor需8次。详细分析两者差异,帮你选择最适合的AI编程工具。
产品体验Cursor云Agent演示:打通软件开发全链路瓶颈
深度解析Cursor云Agent最新Demo,展示如何通过云端虚拟机、自动测试产物和全链路控制平面,系统性消除软件开发生命周期中的人类瓶颈,让Agent自主运行、人按需介入。
产品体验Cursor 3.0深度解析:多Agent并行、Design Mode与Best-of-N模型对比
Cursor 3.0正式发布,从AI辅助编程工具进化为Agent舰队指挥中心。本文详解多智能体并行、Design Mode可视化编辑、Best-of-N多模型择优等核心功能,解读AI编程新范式。