四种AI写图范式:Claude Code和Gemini CLI重塑演示工作流

利用AI工具实现从构思到成品的全自动化图表生成工作流
B站UP主Axton分享了一套AI写图工作流,通过Claude Code和Gemini CLI等工具,覆盖四种范式:Excalidraw手绘图表、Obsidian Canvas知识画布、交互式HTML页面和Gamma PPT演示。核心方法是通过逆向工程设计可复用的"蓝图Prompt",让AI成为思想的执行者,实现从"工具思维"到"系统思维"的跃迁。
从手工拖拽到AI一键生成图表
准备演示或分享时,反复拖拽、对齐图表元素往往消耗大量时间。B站UP主Axton分享了一套完整的AI写图工作流——利用Claude Code和Gemini CLI等工具,实现从构思到成品的全自动化图表生成。

这套方法的核心不在于学会几个新工具,而在于从"工具思维"跃迁到"系统思维"——定义好规则和系统,让AI成为思想的执行者。Axton用自己的文章素材演示了四种AI写图范式,覆盖从自由创作到商务演示的完整场景。
范式一:Claude Code生成Excalidraw手绘图表
逆向工程+蓝图Prompt的核心方法
第一种范式使用Claude Code直接生成Obsidian的Excalidraw图表。Excalidraw是一款开源的虚拟白板工具,以其独特的手绘风格著称——线条带有自然的抖动感,字体模拟手写效果,整体呈现出草图般的亲和力。它的文件格式本质上是JSON结构,包含元素坐标、尺寸、样式等属性字段。在Obsidian生态中,Excalidraw通过社区插件深度集成,支持双向链接和嵌入,使得手绘图表可以成为知识管理的有机组成部分。其文件的结构化特性恰好为AI生成提供了可能——AI只需按照规范输出正确的JSON数据,就能生成完整的可视化图表。
Claude Code是Anthropic推出的命令行AI编程工具,允许开发者在终端中直接与Claude对话来完成代码编写、文件操作和项目管理。与传统的聊天式AI不同,Claude Code可以直接读写本地文件系统、执行命令、理解项目上下文,这使它特别适合需要操作具体文件格式的任务。
具体流程分为几步:
- 建立独立工作目录:为项目创建专属文件夹,方便管理的同时让AI更精确地理解和操作文件
- 逆向工程文件格式:手工创建一个简单的Excalidraw文件,将其交给AI分析文件结构。在软件工程中,逆向工程指的是通过分析成品来推导其设计原理和结构规范。这里的创造性应用是:先手动创建一个最简单的目标格式文件(如只含一个矩形和一行文字),然后让AI分析其内部结构——包括JSON字段含义、坐标系统、样式参数等。AI通过这种分析获得的"格式理解"远比人工编写的格式说明更准确,因为它直接从实例中学习,避免了文档描述与实际实现之间的偏差。
- 生成蓝图Prompt:让AI根据分析结果生成一份可复用的指导性Prompt。蓝图Prompt本质上是一种元提示词(Meta-Prompt)——它不是直接要求AI完成某个具体任务,而是为AI提供一套可复用的操作框架和规范。这个概念借鉴了软件工程中的模板模式(Template Pattern):定义算法骨架,将具体步骤延迟到子类实现。在AI工作流中,蓝图Prompt定义了"如何生成某类图表"的通用规则(文件格式、布局原则、样式规范),而具体内容则在每次调用时动态填入。
- 批量生成图表:用蓝图Prompt指导Claude Code根据任意文章内容自动生成图表
在演示中,Axton让Claude Code根据"MAPS思维框架"文章(Mindset心智模式、Architecture架构设计、Prompt人机对话语言、Systems系统化落地)生成了一张完整的手绘风格图表。生成的图表内容准确,虽然存在对齐等小问题,但稍作调整即可用于演示。
一次投入,无限复用
蓝图Prompt是整个AI写图工作流的灵魂。这种设计将一次性的创意劳动转化为可规模化的系统资产——只需投入一次思考来设计系统,之后就能以近乎零成本的方式反复调用,这正是系统思维带来的效率飞跃。从经济学角度看,这是将边际成本趋近于零的典型案例:固定成本(设计蓝图Prompt)投入一次后,每次额外生成图表的增量成本几乎为零。
范式二:Gemini CLI生成Obsidian Canvas + Claude美化
从知识组织到视觉呈现
如果需求不是从零创作手绘图,而是将知识库中已有的零散笔记在无限画布上重新组织、发现隐藏联系,Obsidian Canvas就是更合适的工具。Obsidian Canvas是Obsidian官方推出的无限画布功能,其文件格式(.canvas)同样基于JSON,包含节点(nodes)和边(edges)两类核心元素。节点可以是文本卡片、嵌入的笔记文件、图片或网页链接;边则定义节点之间的连接关系。Canvas的独特价值在于它不是孤立的绘图工具——每个节点都可以链接到知识库中的实际笔记文件,形成从宏观结构到微观细节的无缝导航。
Axton故意引入Google的Gemini CLI来完成这个任务,目的是证明系统思维的工具无关性。Gemini CLI是Google推出的命令行AI工具,基于Gemini大语言模型,与Claude Code类似支持终端对话式交互,但一个显著优势是它能够直接通过URL访问和解析网页内容,无需用户手动复制粘贴。这种网络访问能力源于Google在搜索和信息检索领域的技术积累。具体操作:
- 使用与Excalidraw相同的方法设计Canvas蓝图Prompt
- 让Gemini CLI根据一篇Newsletter文章生成Obsidian Canvas
- Gemini CLI能直接通过URL读取文章内容,无需本地文件
双AI协同:Claude与Gemini各取所长
Gemini CLI生成的Canvas在标题、段落等基本要素上没有问题,但整体布局和设计感一般。Axton的解决方案是让Claude Code来美化——因为在审美感觉上Claude更胜一筹。这种多AI协同的工作模式反映了当前AI领域的一个重要趋势:没有单一模型在所有维度上都是最优的,聪明的使用者会根据各模型的特长进行任务分配。美化后的Canvas使用了emoji、色彩变换、连接线颜色调整等手段,效果显著提升。
更进一步,Axton还让Gemini CLI从笔记库中自动找出与Canvas内容最相关的2-3份文档,并将它们添加到Canvas中建立引用链接。这展示了Canvas作为"知识沙盘"的强大之处——它不是一张死图,而是可以与整个知识库有机连接的活系统。这种"活链接"特性使Canvas成为知识管理中独一无二的空间化思维工具,用户可以在宏观视图中看到知识的全局结构,同时随时深入任何节点查看完整内容。
范式三:Claude Code生成交互式HTML页面
对于需要公开分享的内容,Claude Code可以直接生成可交互的HTML网页。由于Claude Code本身就是为代码而生,写HTML自然水到渠成。HTML作为输出格式的优势在于其零依赖的普适性——任何设备上的任何浏览器都能直接打开,无需安装特定软件。同时,HTML支持CSS动画、JavaScript交互、响应式布局等丰富特性,使得最终产出物可以远超静态图表的表现力。
同样基于蓝图Prompt(课程讲义展示页面Prompt),Claude Code将文章内容转化为结构清晰、视觉美观的网页,包含核心理念、实践步骤、优势总结等模块。从结构化想法到可发布网页,AI成为最高效的前端开发者。这种方式特别适合制作课程讲义、技术文档、产品介绍页等需要对外传播的内容。
范式四:Gamma一键生成PPT演示文稿
在传统商业场景中,线性演示仍然不可或缺。Gamma.app是一款AI原生的演示文稿生成工具,定位于解决传统PPT制作中设计门槛高、耗时长的痛点。与PowerPoint或Google Slides不同,Gamma从一开始就以AI生成为核心交互方式,用户只需提供内容大纲或原始文本,系统自动完成排版、配色、图片选择等设计决策。它支持多种输出格式,生成的内容可以作为网页直接分享,也可以导出为传统PPT格式。
Gamma.app提供了快速生成PPT的能力:
- 输入方式:粘贴文本、导入文件或URL
- 处理模式:根据大纲生成、总结文档、或保持原样
- 配置选项:文本长度(简约/宽泛)、输出语言、图片来源(AI生成/图片库/网络搜索)
- 主题选择:多种视觉主题可选
整个过程从粘贴内容到生成完整PPT只需几分钟,适合应对高频商务演示需求。在AI工具生态中,Gamma代表了一类"垂直场景AI工具"——专注于单一任务但做到极致易用,与Claude Code、Gemini CLI这类通用型工具形成互补。
系统思维:四种AI写图范式的统一内核
回顾四种范式:
| 范式 | 工具 | 适用场景 |
|---|---|---|
| Excalidraw | Claude Code | 从零创作手绘图表 |
| Canvas | Gemini CLI + Claude | 知识结构化布局 |
| HTML | Claude Code | 对外公开分享 |
| PPT | Gamma | 商务同步演示 |
四个完全不同的场景、四种不同的工具,但内核完全一致:定义系统,让AI执行。这种思维方式与软件工程中的"关注点分离"原则一脉相承——人类负责定义"做什么"和"为什么做"(战略层),AI负责解决"怎么做"(执行层)。当你掌握了这个心法,就不会被任何单一工具绑架,可以自由切换于Claude、Gemini甚至未来任何新AI工具之间。
Axton也提到了未来方向:目前所有操作仍需手动执行指令,下一步是探索让AI Agent实现全链路自动化——从触发到输出完全无人干预。AI Agent(智能体)是当前AI领域最热门的发展方向之一,它指的是能够自主规划、决策和执行多步骤任务的AI系统,不再需要人类逐步下达指令。当AI写图工作流与Agent能力结合,未来可能实现"写完文章后自动生成配套的所有格式图表"这样的端到端自动化。
核心要点
- 四种AI写图范式覆盖从手绘图表、知识画布、HTML网页到PPT的完整演示场景
- 核心方法是通过逆向工程设计"蓝图Prompt",一次投入即可无限复用
- Claude Code和Gemini CLI可以协同工作,各取所长——Gemini负责生成,Claude负责美化
- 系统思维的本质是从追逐工具转向定义规则,实现工具无关的自由切换
- Obsidian Canvas不仅是图表工具,更是可与知识库有机连接的"知识沙盘"
相关推荐
教程攻略Cursor+Codex双IDE协同:开源项目二开实战方法论
基于实战经验总结的开源项目二次开发完整方法论,详解Cursor+Codex双IDE协同工作流,涵盖二开七环节、MVP验证、AI读源码技巧,帮助开发者三天跑通项目、两周完成业务集成。
教程攻略Cursor多Agent实战:50分钟搭建Next.js全栈博客
使用Cursor IDE多Agent协作模式,50分钟内从零搭建全栈博客。涵盖Next.js、Clerk认证、Supabase数据库集成,详解4个AI Agent分阶段开发流程与关键避坑经验。
教程攻略从零搭建AI软件工厂:Cursor工程师的多Agent协作实战经验
Cursor工程师Eric分享AI软件工厂构建实战:从自动化六层级、护栏设计、并行Agent管理到规模化扩展,详解如何用多Agent协作实现7×24小时高效软件开发。