Agent Skills决策树:让AI编程助手实现自主决策

在Agent Skills中嵌入决策树逻辑,让AI编程助手具备自主决策能力
本文介绍了一种在AI编程助手的Agent Skills Markdown文件中嵌入结构化决策树逻辑的高级技巧,通过显式定义条件分支、优先级和异常处理,减少50%-80%的手动干预。以Code Review Router为例,该Skill通过复杂度评分和硬性规则匹配,自动将代码审查路由到Gemini CLI或Codex CLI,并内置容错机制实现故障自动切换。
在使用 Antigravity、Claude Code 等 AI 编程助手时,你是否经常遇到这样的困扰——AI 不断询问"下一步该怎么做",本该自动化完成的工作流变成了低效的人机问答?本文将介绍一种被开发者社区称为"灵魂技术"的高级技巧:在 Agent Skills 中嵌入决策树逻辑,让 AI 编程助手具备真正的自主决策能力,减少 50%-80% 的手动干预。
什么是 Agent Skills 中的决策树
这里的"决策树"并非机器学习中需要训练数据的算法,而是一种在 Skill 的 Markdown 文件中嵌入结构化 if-else 条件分支的技术方案。通过显式定义条件分支、优先级排序和异常处理,AI 编程助手能够自主判断并选择最佳执行方案。
决策树的两种范式:机器学习中的决策树(Decision Tree)是一种监督学习算法,需要从训练数据中归纳出分裂规则,其节点阈值由信息增益、基尼系数等指标自动计算得出。而本文所述的"决策树"是一种专家系统思路——将人类专家的经验规则显式编码为条件分支,属于符号主义 AI 的经典范式。在 AI 编程助手场景中,后者更适合:开发团队的工程规范本身就是最好的"训练数据",直接编码为规则比重新训练模型更高效,且完全透明可控、零训练成本。
用一个生活化的例子来理解:根据天气预报决定是否带伞——有雨则判断雨量大小(大雨带长柄伞、小雨带折叠伞),无雨则根据外出时长决定是否带外套。这种层层递进的条件判断,就是决策树的核心逻辑。

根据 Anthropic 官方文档,Agent Skills 本质上是通过 Markdown 文件教会 AI Agent 完成特定任务。
为什么用 Markdown 来"编程"AI 行为:Agent Skills 是一种「提示词工程的结构化升级」。传统提示词是一次性的自然语言指令,而 Agent Skills 通过 Markdown 文件将任务逻辑持久化、模块化。Anthropic 在设计 Claude 的 Agent 框架时,借鉴了软件工程中「关注点分离」的思想——将「做什么」(任务目标)与「怎么做」(执行逻辑)解耦。Markdown 格式之所以被选为载体,是因为它既对人类可读,又能被 LLM 高效解析,其标题层级(H1/H2/H3)天然映射了任务的层次结构。这种设计让非工程师背景的用户也能通过编写文档的方式「编程」AI 行为,大幅降低了 AI 自动化的门槛。
而决策树优化就是在这个 Markdown 文件中显式定义条件分支、优先级排序和异常处理,从而让 AI 编程助手具备自主判断和选择最佳方案的能力。这一技巧不仅适用于 Antigravity,同样适用于 Claude Code、Codex CLI 等任何支持 Agent Skills 的 AI 编程助手。
实战案例:Code Review Router
设计思路
为了演示决策树的实际效果,我们来看一个名为 Code Review Router 的 Agent Skill。它的核心功能是:让 AI 编程助手智能判断代码变更的类型和复杂度,然后自动路由到最适合的代码审查工具——Gemini CLI 或 Codex CLI。

为什么需要这样的路由?实际开发中,Codex CLI 进行代码审查时速度较慢,适合处理复杂变更或后端技术栈;而 Gemini CLI 更适合前端代码的快速审查。
两款工具的技术定位差异:Gemini CLI 是 Google 基于 Gemini 模型推出的命令行工具,其底层模型在多模态理解和长上下文处理上具有优势,且 Google 为开发者提供了相对宽裕的免费额度,适合高频、轻量的代码审查任务。Codex CLI 则是 OpenAI 推出的代码专用命令行工具,基于经过代码专项训练的模型,在理解复杂架构关系、数据库 Schema 变更和 API 契约分析方面表现更为深入,但推理速度相对较慢、成本较高。这种差异化定位恰好对应了软件工程中「快速反馈」与「深度分析」的双重需求——类似于代码审查流程中「Lint 自动检查」与「人工 Code Review」的分工逻辑。
如果所有任务都用 Antigravity 内置模型完成,不仅效率低下,还会大量消耗 Token 额度。将部分任务分配给外部 CLI 工具,可以实现效率和成本的双重优化。
七步完整执行流程
这个 Skill 的决策流程设计得相当精细,包含以下关键步骤:
第一步:环境检查——判断当前目录是否为 Git 仓库,如果不是则运行 git init 初始化。
第二步:工具可用性检测——检查 Gemini CLI 和 Codex CLI 是否已安装。如果都不可用则自动安装;如果只有一个可用则直接使用该工具。
第三步:分析 Git Diff——运行 git diff 获取代码变更,如果没有变更则直接报告"无需审查"。
第四步:复杂度评分——对代码变更进行 1-10 分的复杂度评估,评分维度包括变更文件数、代码行数、涉及的技术栈等。
复杂度量化的工程意义:代码变更复杂度的量化评估在软件工程领域有深厚的理论基础。经典的圈复杂度(Cyclomatic Complexity)由 Thomas McCabe 于 1976 年提出,通过统计代码中独立路径数量来衡量复杂度。而本文 Skill 中的 1-10 分评分体系是一种更贴近实际工程场景的「启发式评估」,综合考量了变更文件数、代码行数、技术栈跨度等多个维度。这种多维度评分的思路与现代 CI/CD 系统中的「变更风险评估」高度一致——例如 Google 内部的 Critique 系统和 Meta 的 Phabricator 都内置了类似的变更影响面分析机制。将这种工程经验固化到 AI Skill 中,本质上是在将「资深工程师的直觉」转化为「可复用的自动化规则」。

第五步:路由决策(核心决策树节点)——这是整个 Skill 的关键,包含硬性规则匹配和评分决策两层逻辑:
- Codex CLI 硬性规则:代码包含敏感文件、文件数 > 20、行数 > 500、涉及数据库迁移/API 服务层修改、跨 3 个顶级目录、复杂 TypeScript 泛型等
- Gemini CLI 硬性规则:纯前端代码、Python 生态、纯文档变更
- 评分决策:得分 ≥ 6 分由 Codex 深度分析,< 6 分由 Gemini 快速反馈
- 默认策略:无明确匹配时默认使用 Gemini CLI
第六步:执行与容错——调用选定的 CLI 执行审查。如果执行失败(如网络问题),自动切换到备用 CLI 重新执行。
容错设计的系统工程视角:自动切换备用工具的容错设计,体现了分布式系统中「故障转移(Failover)」的核心思想。在微服务架构中,这通常通过熔断器模式(Circuit Breaker Pattern)实现——当主服务连续失败超过阈值时,自动切换到降级服务。将这一模式引入 AI Agent 工作流,解决了 AI 自动化落地的一个关键痛点:外部工具的不稳定性(网络波动、API 限流、服务宕机)会导致整个自动化流程中断。通过在 Skill 文件中显式定义「执行失败 → 检测错误类型 → 切换备用工具 → 重新执行」的恢复路径,AI Agent 获得了类似生产级软件系统的健壮性。这也说明,优秀的 Agent Skill 设计不仅要考虑「正常路径」,更要系统性地规划「异常路径」。
第七步:格式化输出——生成包含严重程度分类的结构化审查报告。
实际演示效果
在演示中,作者在一个 Chrome 扩展项目上新增了一个功能(点击日志条目打开对应的任务记录),然后通过斜杠命令 /review 触发代码审查 Skill。
AI 检测到变更包括 9 个文件,复杂度评分为 3/10(代码行数 < 300),属于纯前端 JS 变更,无敏感代码、无数据库或 API 修改。基于这些判断,决策树自动选择了 Gemini CLI 进行审查。
为了测试容错能力,作者在 Gemini CLI 开始执行时故意断开了网络。Skill 立即检测到错误,自动切换到 Codex CLI 作为备选方案完成了审查,并输出了包含性能问题、安全问题和修复建议的完整报告。

斜杠命令配置:快速调用 Agent Skill
将 Agent Skill 配置为斜杠命令可以大幅提升使用效率,具体步骤如下:
- 确保 Agent Skills 文件已放置在项目工作路径下(Antigravity、Claude Code、Codex 都会优先加载项目路径下的 Skill)
- 点击 Antigravity 右上方的三个点 → 自定义 → Workflow → Workspace
- 新建一个工作流,命名为
review - 在描述中填写"代码审查,遵循团队标准"
- 在内容中使用
@符号引用代码审查 Skill 文件,并设置审查规则(如"审查用户指定的文件,未指定则审查所有变更") - 保存后,在输入框中输入
/review即可快速调用
决策树技术的更多应用场景
代码审查只是决策树 Agent Skills 的一个应用场景。这种模式可以扩展到更多开发工作流中:
- 测试策略路由:根据代码变更类型自动选择单元测试、集成测试或端到端测试方案
- 部署决策:根据变更范围和风险等级自动选择灰度发布或全量发布
- 文档生成:根据代码类型自动选择 API 文档、用户手册或内部技术文档的生成模板
- 性能优化:根据代码特征自动选择不同的性能分析工具和优化策略
决策树的核心价值在于将开发者的经验和判断逻辑固化到 Skill 文件中,让 AI 编程助手从"被动执行者"升级为"主动决策者"。这不仅提升了自动化程度,更重要的是确保了决策的一致性和可预测性——每次面对相同条件时,AI 都会做出相同的最优选择。
核心要点
- 决策树是在Agent Skills的Markdown文件中嵌入结构化if-else逻辑,让AI编程助手具备自主决策能力,可减少50%-80%的手动干预
- Code Review Router通过复杂度评分和硬性规则匹配,自动将代码审查任务路由到Gemini CLI或Codex CLI,实现智能工具选择
- 决策树Skill内置完善的容错机制(类似分布式系统的故障转移模式),当首选工具执行失败时自动切换备用工具,确保任务完成
- 将审查任务分配给外部CLI工具而非全部使用内置模型,可有效节省Antigravity的Token额度
- 该技巧适用于Antigravity、Claude Code、Codex等所有支持Agent Skills的AI编程助手,可扩展到测试、部署、文档生成等多种场景
相关推荐
教程攻略Cursor+Codex双IDE协同:开源项目二开实战方法论
基于实战经验总结的开源项目二次开发完整方法论,详解Cursor+Codex双IDE协同工作流,涵盖二开七环节、MVP验证、AI读源码技巧,帮助开发者三天跑通项目、两周完成业务集成。
教程攻略Cursor多Agent实战:50分钟搭建Next.js全栈博客
使用Cursor IDE多Agent协作模式,50分钟内从零搭建全栈博客。涵盖Next.js、Clerk认证、Supabase数据库集成,详解4个AI Agent分阶段开发流程与关键避坑经验。
教程攻略从零搭建AI软件工厂:Cursor工程师的多Agent协作实战经验
Cursor工程师Eric分享AI软件工厂构建实战:从自动化六层级、护栏设计、并行Agent管理到规模化扩展,详解如何用多Agent协作实现7×24小时高效软件开发。