吴恩达Agent Skills课程详解：为AI代理构建可复用专业技能

课程概述：什么是Agent Skills

吴恩达（Andrew Ng）与Anthropic合作推出了一门全新课程——Agent Skills，由讲师Ellie Sherwick主讲。这门课程聚焦于如何为Claude Code及其他AI代理赋予新的能力，让它们能够执行更复杂、更专业的任务。

Agent Skills课程封面

Skills（技能）本质上是一组指令文件夹，通过专业化的知识来扩展AI代理的能力边界。更值得关注的是，Skills已经成为一个开放标准——你只需构建一次技能，就可以将其部署到多个兼容Skills标准的代理产品中，大幅降低重复开发成本。

Skills作为开放标准的意义需要放在AI代理生态的大背景下理解。当前AI代理领域面临严重的碎片化问题——不同平台（如OpenAI的GPTs、Google的Gemini Extensions、Anthropic的Claude）各自定义了不同的能力扩展方式，开发者往往需要为每个平台重复构建类似功能。Skills标准的提出类似于Web领域HTML标准的作用：通过统一的接口规范，让能力描述具有可移植性。这与Anthropic此前推出的MCP（Model Context Protocol）战略一脉相承——Anthropic正在系统性地推动AI基础设施的标准化，从工具调用协议到技能描述格式，试图建立类似互联网协议栈的AI代理基础层。

Skills的核心架构解析

文件结构

每个Skill必须包含一个skill.md Markdown文件，其中定义了：

技能名称：简洁描述技能的用途
技能描述：触发条件的关键信息
主要指令：具体的执行步骤和规则

主要指令还可以引用其他文件，包括脚本、额外的Markdown文件，以及模板和图片等资源文件。这种模块化的设计让技能的维护和迭代变得非常灵活。

渐进式加载机制

Skills采用了一种称为"渐进式披露"（Progressive Disclosure）的智能机制，有效解决了上下文窗口的容量限制问题：

始终在上下文中：技能的名称和描述会持续存在于代理的上下文窗口中
按需加载：只有当用户请求与技能描述匹配时，代理才会将完整指令加载到上下文中
深度加载：在需要时，代理还会进一步加载引用文件和资源文件

这种设计巧妙地平衡了上下文窗口的有限空间与技能的丰富性，避免了不必要的token消耗，是Skills架构中最精妙的部分之一。

从技术原理来看，渐进式披露借鉴了用户界面设计中的同名概念，但在AI代理场景中解决的是一个更底层的技术问题——上下文窗口的token限制。即使是最先进的大语言模型，其上下文窗口也是有限的（Claude 3.5 Sonnet为200K tokens），如果将所有可用技能的完整指令同时加载，会迅速耗尽可用空间，导致模型无法处理用户的实际请求。Skills的渐进式加载本质上是一种懒加载（Lazy Loading）策略，类似于操作系统中的虚拟内存机制——只有被实际访问的页面才会加载到物理内存中。技能的名称和描述充当了"索引"角色，占用极少的token但提供了足够的语义信息供模型判断何时需要加载完整内容。

Skills的工具依赖与组合能力

要使用Skill，AI代理需要具备一组基础工具：

文件系统访问：能够读写文件
批处理工具：能够执行代码

这些工具使代理能够执行技能所要求的各种命令。更强大的是，代理可以将Skills与MCP（Model Context Protocol）和子代理（Subagents）结合，创建复杂的代理工作流。

组合使用场景

Skills + MCP：通过MCP从外部数据源获取数据，然后依靠Skill来指导如何处理这些数据或如何高效检索
Skills + 子代理：将任务委派给具有隔离上下文的子代理，子代理本身也可以使用Skills来获取专业知识

MCP（Model Context Protocol）是Anthropic于2024年底开源的一项通信协议，旨在标准化AI模型与外部工具、数据源之间的交互方式。在MCP出现之前，每个AI应用都需要为每个外部服务编写定制化的集成代码，导致N×M的复杂度爆炸问题。MCP通过定义统一的客户端-服务器架构，将这一复杂度降低为N+M——任何支持MCP的AI代理都可以连接任何MCP服务器。MCP服务器可以暴露三种能力：工具（Tools）、资源（Resources）和提示（Prompts）。Skills与MCP的结合意味着：MCP负责"能做什么"（工具能力），而Skills负责"怎么做"（执行策略和领域知识），两者形成互补。

子代理（Subagents）是多代理系统（Multi-Agent Systems）中的核心概念。在这种架构中，一个主代理（Orchestrator）将复杂任务分解为子任务，并委派给专门的子代理执行。每个子代理拥有独立的上下文窗口，这意味着它不会被主代理的其他任务信息所干扰，能够专注于自己的子任务。这种设计解决了两个关键问题：一是单一上下文窗口的容量限制，通过分布式处理突破单模型的token上限；二是任务隔离，避免不同任务之间的信息干扰导致输出质量下降。Claude Agent SDK提供了创建和管理子代理的编程接口，开发者可以定义代理间的通信协议和任务分配策略。

这种组合能力让Skills不再是孤立的指令集，而是可以融入整个AI代理生态的核心组件。

课程实战内容：四阶段学习路径

这门课程设计了从入门到进阶的完整学习路径，覆盖多种实际应用场景：

第一阶段：Claude AI平台实战

创建营销活动（Marketing Campaign）技能
与预构建的Excel和PowerPoint技能组合使用
体验Skills如何简化重复性工作流

第二阶段：Claude API集成

构建内容创作（Content Creation）技能
构建数据分析（Data Analysis）技能
通过API调用验证技能的通用性

第三阶段：代码开发场景

使用Claude Code进行代码审查
自动化测试流程
将编码最佳实践封装为可复用技能

第四阶段：高级代理构建

使用Claude Agent SDK构建研究代理
利用Skill整合多源研究结果
实现端到端的自动化研究工作流

何时应该使用Skills

吴恩达在课程中给出了一个简洁的判断标准：当你发现自己反复向AI代理解释同一个工作流时，就应该将其封装为Skill。

这个理念与软件工程中的DRY原则（Don't Repeat Yourself）一脉相承。与其每次都从头描述复杂的工作流程，不如将其标准化为一个技能包，让代理自动识别并执行。这不仅节省时间，还能确保执行的一致性和可靠性。

DRY原则最初由Andy Hunt和Dave Thomas在《程序员修炼之道》（The Pragmatic Programmer）中提出，强调系统中每一项知识都应该有一个单一、明确、权威的表示。在传统软件工程中，DRY通过函数封装、模块化和代码复用来实现。在AI代理的语境下，DRY原则获得了新的含义：重复不再是代码层面的重复，而是"提示词层面的重复"——用户反复用自然语言描述相同的工作流程。Skills将这种隐性的重复知识显性化、结构化，使其成为可版本控制、可共享、可测试的工程制品。这标志着AI应用开发正在从"对话式交互"向"工程化管理"演进。

总结与展望

Agent Skills代表了AI代理能力扩展的一个重要方向。它的开放标准特性带来了三个关键优势：

生态共建：开发者社区可以共享和复用技能，加速AI应用的落地
跨平台兼容：一次构建，多处部署，降低迁移成本
渐进式复杂度：从简单的文件操作到复杂的多代理协作，满足不同层级的需求

对于AI开发者和高级用户而言，掌握Skills的构建方法将成为提升工作效率的关键能力。这门课程提供了从概念理解到实战应用的完整路径，无论你是刚接触AI代理开发，还是希望优化现有工作流，都能从中获得实用的方法论。