AI Skill开发实战：测试驱动迭代流程与模型搭配策略

引言

很多人以为开发一个AI Skill需要从零编写大量代码，但实际上，借助Skill Creator等工具，整个开发过程更像是一个「描述需求→生成初版→测试反馈→迭代优化」的循环。本文将分享一套经过实践验证的Skill开发流程，核心理念是：好的Skill不是写出来的，而是测出来、改出来、迭代出来的。

什么是AI Skill？ AI Skill（AI技能/插件）是封装了特定任务逻辑的可复用AI执行单元——本质上是结构化提示词与代码逻辑的组合体，能够接收特定输入、执行预定义的处理流程、并输出标准化结果。与传统软件模块不同，AI Skill的核心竞争力在于「意图理解」能力：它不依赖硬编码规则，而是通过大语言模型（LLM）理解上下文并灵活处理边界情况。这一特性使得Skill开发的瓶颈从「如何编写逻辑」转移到了「如何清晰描述意图」，这也是为什么描述需求比写代码更重要的根本原因。

清晰描述Skill的输入输出

开发Skill的起点不是写代码，而是把需求描述清楚。具体来说，需要明确三个核心要素：

输入是什么：源码文件、截图、Markdown文件等
输出是什么：需求说明、HTML原型、Design MD文件等
处理过程是什么：拿到输入后分几步分析，每一步判断什么，最终生成什么结果

如果对输出有参考文档，比如希望生成的文档格式参考某个Markdown模板，或者内部处理逻辑参考了某个脚本代码，都应该一并提供给模型。这样生成的Skill不是凭空想象的，而是基于真实代码逻辑来实现的。

工具选择与模型搭配策略

在工具选择上，推荐采用分阶段搭配的策略：

CodeX：用于第一版开发，利用其强大的代码生成能力快速出稿
Claude Code：搭配DeepSeek和Kimi，用于Skill的验证和测试
如果CodeX额度用完，也可以在Claude Code中搭配Claude模型或GPT进行初版开发

为什么这样分工？ CodeX是OpenAI推出的专注于代码理解与生成的AI模型，在大量开源代码数据上进行了专项微调，特别擅长「从自然语言描述直接生成完整代码骨架」，适合冷启动阶段。Claude Code则是Anthropic推出的命令行AI编程助手，能够直接读取本地文件系统、执行终端命令、修改代码文件，依托200K token的超长上下文窗口理解大型代码库全局结构，其「Agentic」特性（自主规划任务、调用工具、执行操作）使其特别适合验证与迭代阶段。DeepSeek以极高性价比著称，API成本仅为主流闭源模型的1/10甚至更低，是高频测试验证的理想选择；Kimi则以百万级token的超长上下文处理能力见长，适合分析大量参考文档的场景。

Claude Code模型切换工具

CC Switch：灵活切换模型的利器

这里推荐一个实用工具——CC Switch，它可以帮助你在Claude Code中灵活配置和切换多种模型。配置步骤如下：

在CC Switch中添加自定义配置
供应商名称和链接可以随意填写
API Key需要通过「更新密钥」或「获取密钥」来获取
请求地址填写对应平台显示的BaseURL
模型根据需求配置，不填则默认使用Claude推荐模型

配置完成后，需要使用哪个模型时点击「启用」即可。这种灵活性让开发流程更加高效：用Claude或GPT生成第一稿，用DeepSeek或Kimi进行测试验证，根据测试结果再反馈给CodeX或Claude Code进行后续迭代。

实战案例：Design Generator Skill迭代升级

以Design Generator这个Skill为例，展示完整的迭代升级过程。

从v1.0到v2.0的升级背景

Design Generator基于开源项目Awesome Design MD生成设计规范文件。该开源项目从v1.0升级到了v2.0：

v1.0：面向人的阅读和理解
v2.0：增加了Token和组件的定义，更适合AI与代码生成

Design MD 的技术价值 Design MD（设计规范Markdown文件）是将视觉设计系统结构化为机器可读格式的技术规范文档。传统设计规范（如Figma文件、PDF设计手册）主要面向人类设计师，而Design MD的核心创新在于将颜色Token、字体比例、间距系统、组件变体等设计决策编码为标准化Markdown结构，使AI模型能够直接解析并在代码生成时精确遵循这些约束。v1.0到v2.0的升级，本质上是设计系统从「人类可读」向「AI可消费」的范式转变——v2.0引入的Token体系让AI在生成前端代码时能够精确引用设计变量，而非依赖模糊的自然语言描述，从而大幅提升设计还原度。

Design Generator Skill项目

升级执行流程

首先，告诉模型分析当前项目路径下的Skill，并结合v2.0文件夹中的内容，给出升级方案。模型会返回升级建议，如果有疑问可以继续沟通交流，在对话过程中不断完善最终方案。确认方案后，指示模型执行升级。

测试与验证结果

升级完成后，直接在项目路径下执行Design Generator Skill，它会生成对应的Design MD文件，包含：

使用说明和设计系统概述
字体排版、间距、圆角、图标规范
表格、Tag样式定义
布局规范和来源摘要
Preview版页面（含颜色体系、字体布局、图标）

生成的Design MD文件内容

发现问题并针对性修复

测试中发现了一个典型问题：生成的样例文件中，顶部导航栏的颜色取错了，没有按照设计规范来取色。

定位问题根因

在Design Generator Skill的路径下启动Claude Code，直接描述问题：「当前项目测试中顶部导航栏颜色应该是XX颜色，请分析没有取到这个颜色的原因。」模型会分析原因并给出修复建议。

根据复杂度选择修复模型

根据修复的复杂度选择合适的模型：

简单修改：使用DeepSeek，响应快、成本低
复杂优化：使用Claude或GPT，先出设计方案再执行

使用DeepSeek进行迭代修复