AI Skill开发实战:测试驱动迭代流程与模型搭配策略

AI Skill开发的核心是描述需求、测试反馈、迭代优化的循环流程。
本文分享了一套经过实践验证的AI Skill开发流程,核心理念是"好的Skill是测出来、改出来、迭代出来的"。开发起点是清晰描述输入输出和处理过程,工具上推荐CodeX生成初版、Claude Code搭配DeepSeek/Kimi进行验证测试,并通过CC Switch灵活切换模型。文章以Design Generator Skill从v1.0到v2.0的升级为实战案例,展示了完整的迭代优化过程。
引言
很多人以为开发一个AI Skill需要从零编写大量代码,但实际上,借助Skill Creator等工具,整个开发过程更像是一个「描述需求→生成初版→测试反馈→迭代优化」的循环。本文将分享一套经过实践验证的Skill开发流程,核心理念是:好的Skill不是写出来的,而是测出来、改出来、迭代出来的。
什么是AI Skill? AI Skill(AI技能/插件)是封装了特定任务逻辑的可复用AI执行单元——本质上是结构化提示词与代码逻辑的组合体,能够接收特定输入、执行预定义的处理流程、并输出标准化结果。与传统软件模块不同,AI Skill的核心竞争力在于「意图理解」能力:它不依赖硬编码规则,而是通过大语言模型(LLM)理解上下文并灵活处理边界情况。这一特性使得Skill开发的瓶颈从「如何编写逻辑」转移到了「如何清晰描述意图」,这也是为什么描述需求比写代码更重要的根本原因。
清晰描述Skill的输入输出
开发Skill的起点不是写代码,而是把需求描述清楚。具体来说,需要明确三个核心要素:
- 输入是什么:源码文件、截图、Markdown文件等
- 输出是什么:需求说明、HTML原型、Design MD文件等
- 处理过程是什么:拿到输入后分几步分析,每一步判断什么,最终生成什么结果
如果对输出有参考文档,比如希望生成的文档格式参考某个Markdown模板,或者内部处理逻辑参考了某个脚本代码,都应该一并提供给模型。这样生成的Skill不是凭空想象的,而是基于真实代码逻辑来实现的。
工具选择与模型搭配策略
在工具选择上,推荐采用分阶段搭配的策略:
- CodeX:用于第一版开发,利用其强大的代码生成能力快速出稿
- Claude Code:搭配DeepSeek和Kimi,用于Skill的验证和测试
- 如果CodeX额度用完,也可以在Claude Code中搭配Claude模型或GPT进行初版开发
为什么这样分工? CodeX是OpenAI推出的专注于代码理解与生成的AI模型,在大量开源代码数据上进行了专项微调,特别擅长「从自然语言描述直接生成完整代码骨架」,适合冷启动阶段。Claude Code则是Anthropic推出的命令行AI编程助手,能够直接读取本地文件系统、执行终端命令、修改代码文件,依托200K token的超长上下文窗口理解大型代码库全局结构,其「Agentic」特性(自主规划任务、调用工具、执行操作)使其特别适合验证与迭代阶段。DeepSeek以极高性价比著称,API成本仅为主流闭源模型的1/10甚至更低,是高频测试验证的理想选择;Kimi则以百万级token的超长上下文处理能力见长,适合分析大量参考文档的场景。

CC Switch:灵活切换模型的利器
这里推荐一个实用工具——CC Switch,它可以帮助你在Claude Code中灵活配置和切换多种模型。配置步骤如下:
- 在CC Switch中添加自定义配置
- 供应商名称和链接可以随意填写
- API Key需要通过「更新密钥」或「获取密钥」来获取
- 请求地址填写对应平台显示的BaseURL
- 模型根据需求配置,不填则默认使用Claude推荐模型
配置完成后,需要使用哪个模型时点击「启用」即可。这种灵活性让开发流程更加高效:用Claude或GPT生成第一稿,用DeepSeek或Kimi进行测试验证,根据测试结果再反馈给CodeX或Claude Code进行后续迭代。
实战案例:Design Generator Skill迭代升级
以Design Generator这个Skill为例,展示完整的迭代升级过程。
从v1.0到v2.0的升级背景
Design Generator基于开源项目Awesome Design MD生成设计规范文件。该开源项目从v1.0升级到了v2.0:
- v1.0:面向人的阅读和理解
- v2.0:增加了Token和组件的定义,更适合AI与代码生成
Design MD 的技术价值 Design MD(设计规范Markdown文件)是将视觉设计系统结构化为机器可读格式的技术规范文档。传统设计规范(如Figma文件、PDF设计手册)主要面向人类设计师,而Design MD的核心创新在于将颜色Token、字体比例、间距系统、组件变体等设计决策编码为标准化Markdown结构,使AI模型能够直接解析并在代码生成时精确遵循这些约束。v1.0到v2.0的升级,本质上是设计系统从「人类可读」向「AI可消费」的范式转变——v2.0引入的Token体系让AI在生成前端代码时能够精确引用设计变量,而非依赖模糊的自然语言描述,从而大幅提升设计还原度。

升级执行流程
首先,告诉模型分析当前项目路径下的Skill,并结合v2.0文件夹中的内容,给出升级方案。模型会返回升级建议,如果有疑问可以继续沟通交流,在对话过程中不断完善最终方案。确认方案后,指示模型执行升级。
测试与验证结果
升级完成后,直接在项目路径下执行Design Generator Skill,它会生成对应的Design MD文件,包含:
- 使用说明和设计系统概述
- 字体排版、间距、圆角、图标规范
- 表格、Tag样式定义
- 布局规范和来源摘要
- Preview版页面(含颜色体系、字体布局、图标)

发现问题并针对性修复
测试中发现了一个典型问题:生成的样例文件中,顶部导航栏的颜色取错了,没有按照设计规范来取色。
定位问题根因
在Design Generator Skill的路径下启动Claude Code,直接描述问题:「当前项目测试中顶部导航栏颜色应该是XX颜色,请分析没有取到这个颜色的原因。」模型会分析原因并给出修复建议。
根据复杂度选择修复模型
根据修复的复杂度选择合适的模型:
- 简单修改:使用DeepSeek,响应快、成本低
- 复杂优化:使用Claude或GPT,先出设计方案再执行

Skill开发的核
相关推荐
教程攻略Cursor+Codex双IDE协同:开源项目二开实战方法论
基于实战经验总结的开源项目二次开发完整方法论,详解Cursor+Codex双IDE协同工作流,涵盖二开七环节、MVP验证、AI读源码技巧,帮助开发者三天跑通项目、两周完成业务集成。
教程攻略Cursor多Agent实战:50分钟搭建Next.js全栈博客
使用Cursor IDE多Agent协作模式,50分钟内从零搭建全栈博客。涵盖Next.js、Clerk认证、Supabase数据库集成,详解4个AI Agent分阶段开发流程与关键避坑经验。
教程攻略从零搭建AI软件工厂:Cursor工程师的多Agent协作实战经验
Cursor工程师Eric分享AI软件工厂构建实战:从自动化六层级、护栏设计、并行Agent管理到规模化扩展,详解如何用多Agent协作实现7×24小时高效软件开发。