baoyu-skills:一句话让AI自动为文章配图的开源技能集

baoyu-skills开源项目让AI自动为文章分析结构、生成配图并插入,解决自媒体配图痛点
baoyu-skills是GitHub上近19000 Star的开源技能集,适用于Claude Code、Codex等AI工具。它通过结构化提示词与工具调用规则,让AI自动分析文章结构、选择配图风格、生成图片并插入正确位置,用户无需掌握提示词工程,仅用自然语言即可完成配图,代表了AI从单点工具向智能体工作流自动化演进的趋势。
自媒体配图的痛点
写文章的人都知道,内容创作中最耗时的环节往往不是写作本身,而是配图。打开绘图工具、构思提示词、生成图片、筛选满意的、再插入到正确位置——这一套流程下来,半小时轻松就没了。更让人崩溃的是,花了大量时间生成的图片,效果还经常不尽如人意。
这里的核心障碍在于**提示词工程(Prompt Engineering)**的复杂性。对于图像生成模型(如Stable Diffusion、DALL-E、Midjourney等),提示词的质量直接决定生成图片的风格、构图和细节。专业的图像提示词往往需要包含主体描述、风格关键词、光线设定、构图参数等多个维度,学习曲线相当陡峭。对于以内容为核心的自媒体创作者而言,这种额外的技术门槛往往让配图环节成为整个创作流程中最令人抓狂的部分。

这个痛点催生了一个在 GitHub 上获得近 19000 Star 的开源项目——baoyu-skills(宝玉技能集),它专门解决 AI 辅助创作中的配图效率问题。
baoyu-skills 是什么?
核心定位
baoyu-skills 是一套适用于 Claude Code、Codex 等 AI 编程/对话工具的技能集(Skills),其中最受欢迎的功能是「文章自动配图」。
所谓「技能集」,本质上是一套结构化的系统提示词(System Prompt)与工具调用规则的组合。在 Claude Code、Codex 等 AI 编程助手中,开发者可以通过注入自定义指令来扩展 AI 的默认行为边界,使其具备特定领域的专业能力。这种模式类似于浏览器插件或 IDE 扩展——让通用 AI 具备垂直场景的专项技能,而无需用户每次手动编写复杂的指令。
baoyu-skills 的工作原理并不复杂:将一套精心设计的指令规则注入到 AI 对话环境中,让 AI 具备自动分析文章结构、判断配图位置、选择合适风格并生成图片的能力。

工作流程
使用时,你只需要把文章内容丢给 AI,然后说一句「用宝玉技能帮我做图」,AI 就会自动完成以下步骤:
- 分析文章结构:识别哪些段落需要配图,哪些概念适合可视化
- 选择图片风格:根据文章调性自动匹配风格,支持科技感、手绘、极简等九种预设风格
- 生成图片:调用图像生成模型创建配图
- 自动插入:将图片放置到文章的正确位置
整个过程大约三分钟,从纯文字变成图文并茂的完整文章。
实际使用效果如何?

从实际演示来看,baoyu-skills 生成的配图质量相当不错,而且支持交互式修改。如果对某张图不满意,可以直接用自然语言提出修改要求,比如「第二张加个箭头」「再多两张图」,AI 会立即响应调整。
这种交互方式相比传统的图片生成工具有明显优势:
- 零学习成本:不需要学习复杂的提示词工程,AI 在后台自动将你的意图转化为专业的图像生成指令
- 上下文感知:AI 理解文章内容,配图更贴合主题,而非孤立地生成一张与内容割裂的图片
- 迭代方便:修改只需一句话,不用重新走完整流程
安装与使用指南

配置步骤
使用 baoyu-skills 只需两步:
第一步:安装技能集
从 GitHub 仓库获取 baoyu-skills 的配置文件,按照项目文档将其集成到你使用的 AI 工具中(如 Claude Code 或 Codex)。
第二步:在对话中调用
在与 AI 的对话中,直接说「用宝玉技能帮我做图」,然后提供你的文章内容即可。
注意事项
- 部分图片生成功能需要调用云端模型,可能涉及 API 费用
- 不同的 AI 工具对技能集的支持程度可能有差异
- 建议先用短文章测试效果,熟悉后再处理长文
对内容创作者的实际意义
baoyu-skills 代表了一个重要趋势:AI 工具正在从单点能力走向工作流自动化。
这一演进方向在业界被称为 Agentic Workflow(智能体工作流),是当前大模型应用的核心发展方向。区别于早期「一问一答式」的 AI 交互,工作流自动化让 AI 能够拆解复杂任务、调用多种外部工具、在多个步骤间保持上下文连贯性,最终完成端到端的复合任务。Anthropic、OpenAI 等头部机构均在 2024 年前后密集发布了支持工具调用(Tool Use / Function Calling)的模型能力,为类似 baoyu-skills 这样的自动化工具提供了坚实的底层支撑。
过去我们用 AI 生成图片,还是需要人工判断在哪里插图、用什么风格、怎么排版。现在这些决策也可以交给 AI 来完成——这正是从「AI 作为工具」到「AI 作为协作者」的关键跃迁。
对于日更的自媒体创作者来说,每篇文章节省 20-30 分钟的配图时间,一个月下来就是 10 多个小时。这些时间可以用来打磨内容质量,或者简单地让自己少加一会儿班。
当然,AI 自动配图目前还无法完全替代专业设计师的审美判断,但对于大多数内容创作场景来说,它已经是一个足够好的解决方案。
核心要点
- baoyu-skills 是 GitHub 上近 19000 Star 的开源技能集,专为 Claude Code、Codex 等工具设计
- 技能集本质是结构化系统提示词与工具调用规则的组合,让通用 AI 具备垂直场景专项能力
- 核心功能是文章自动配图:AI 自动分析文章结构、选择风格、生成图片并插入正确位置,用户无需掌握提示词工程
- 支持九种预设风格和自然语言交互修改,整个配图过程约三分钟完成
- 安装使用仅需两步:集成技能集配置文件,然后在对话中用自然语言调用
- 代表了 AI 工具从单点能力向 Agentic Workflow(智能体工作流自动化)演进的行业趋势
相关推荐
教程攻略Cursor+Codex双IDE协同:开源项目二开实战方法论
基于实战经验总结的开源项目二次开发完整方法论,详解Cursor+Codex双IDE协同工作流,涵盖二开七环节、MVP验证、AI读源码技巧,帮助开发者三天跑通项目、两周完成业务集成。
教程攻略Cursor多Agent实战:50分钟搭建Next.js全栈博客
使用Cursor IDE多Agent协作模式,50分钟内从零搭建全栈博客。涵盖Next.js、Clerk认证、Supabase数据库集成,详解4个AI Agent分阶段开发流程与关键避坑经验。
教程攻略从零搭建AI软件工厂:Cursor工程师的多Agent协作实战经验
Cursor工程师Eric分享AI软件工厂构建实战:从自动化六层级、护栏设计、并行Agent管理到规模化扩展,详解如何用多Agent协作实现7×24小时高效软件开发。