吴恩达联合Anthropic推出Agent Skills课程:一次构建,多平台部署

课程概览:什么是Agent Skills?
吴恩达(Andrew Ng)与Anthropic合作推出了一门全新课程——Agent Skills,由讲师Ellie Sherwick主讲。这门课程聚焦于一个核心概念:Skills(技能)是赋予Claude Code及其他AI Agent新能力的指令文件夹,它们能够显著扩展Agent的任务执行范围。
简单来说,如果你有一个反复让Agent执行的工作流程,与其每次都从头解释一遍,不如将其打包成一个Skill,让Agent自动知道该怎么做。这就是Skills的核心价值——将重复性的专业知识封装为可复用的能力模块。这一理念与软件工程中的"Don't Repeat Yourself"(DRY)原则高度一致,本质上是将Prompt Engineering从一次性的对话行为,提升为可版本管理、可共享、可组合的工程实践。



Skills的技术架构
标准化文件结构
每个Skill本质上是一个包含指令的文件夹,其核心是一个skill.md Markdown文件,包含三个关键要素:
- 技能名称(Name):标识该技能的用途
- 技能描述(Description):说明该技能适用的场景
- 主要指令(Main Instructions):详细的执行步骤
主指令还可以引用其他文件,包括脚本、额外的Markdown文件,以及模板和图片等资产文件。这种模块化设计让Skills既保持了简洁性,又具备足够的灵活性。选择Markdown作为核心格式并非偶然——Markdown是开发者生态中最通用的文档格式,具备良好的人类可读性和机器可解析性,同时与Git版本控制系统天然兼容,便于团队协作和迭代管理。
渐进式上下文加载机制
课程中提到了一个非常重要的设计理念——渐进式披露(Progressive Disclosure)。这一概念最初来源于人机交互设计领域,由IBM研究员John M. Carroll在1980年代提出,核心思想是只在用户需要时才展示复杂信息。在AI Agent的语境下,这一设计理念被重新诠释为上下文管理策略。
其工作原理如下:
- 技能的名称和描述始终存在于Agent的上下文窗口中
- 只有当用户请求与某个技能的描述匹配时,Agent才会将该技能的完整指令加载到上下文中
- 如果需要,Agent还会进一步加载引用文件和资产文件
这种机制有效避免了上下文窗口的浪费,让Agent在拥有大量技能的情况下依然保持高效响应。这是一个精巧的工程设计,直接解决了大语言模型上下文长度有限这一现实约束。当前主流大语言模型的上下文窗口虽然已从早期的4K tokens扩展到100K甚至更长,但上下文越长,推理成本越高、注意力稀释越严重(即"Lost in the Middle"问题——研究表明模型对上下文中间位置的信息检索能力显著下降)。因此,即便技术上可以塞入更多信息,精细化的上下文管理仍然是提升Agent性能的关键工程实践。
基础工具要求
要让Agent使用Skill,需要两个基本工具:
- 文件系统访问权限:用于读写文件
- 批处理工具(Batch Tool):用于执行代码
这两个工具使Agent能够执行Skill中定义的各种命令和操作。值得注意的是,这两个工具本质上赋予了Agent与操作系统交互的能力——文件系统访问让Agent能够读取Skill定义和相关资产,而批处理工具则让Agent能够执行Shell命令、运行脚本,从而将文本指令转化为实际的系统操作。这也是Claude Code等终端级AI工具与传统聊天机器人的根本区别所在。
开放标准:一次构建,多平台部署
课程中最值得关注的信息之一是:Skills已经成为一个开放标准(Open Standard)。这意味着Skills拥有标准化的格式,可以与任何兼容Skills的Agent产品配合使用。
这一点的战略意义不可低估。历史上,技术生态的繁荣往往依赖于开放标准的确立——HTTP之于互联网、USB之于硬件外设、Docker之于容器化部署。在AI Agent领域,开放标准的缺失曾导致严重的生态碎片化:每个Agent框架(如LangChain、AutoGen、CrewAI)都有自己的能力定义方式,开发者的工作无法跨平台复用。
开发者只需构建一次Skill,就可以将其部署到多个Agent产品中,大幅降低了重复开发的成本。这与MCP(Model Context Protocol)的理念一脉相承——通过标准化协议打通不同AI系统之间的壁垒。Skills标准的开放化,正在构建一个类似于"AI Agent的USB接口"——即插即用的能力扩展体系。
Skills与MCP、子Agent的协同
课程特别强调了Skills并非孤立存在,而是可以与MCP和子Agent(Subagent)组合,构建强大的Agentic工作流:
-
Skills + MCP:MCP负责从外部数据源获取数据,Skill则告诉Agent如何处理这些数据或如何高效检索。MCP(Model Context Protocol)是Anthropic于2024年底推出的开放协议,旨在为AI模型与外部数据源、工具之间建立标准化的通信接口。在MCP出现之前,每个AI应用都需要为每个数据源编写定制化的集成代码,形成了M×N的复杂度问题。MCP通过定义统一的协议层,将这一复杂度降低为M+N——任何支持MCP的模型都可以连接任何支持MCP的数据源。
-
Skills + 子Agent:Agent可以将任务委托给拥有隔离上下文的子Agent,而子Agent本身也可以使用Skills来获取专业知识。子Agent是多Agent系统(Multi-Agent System)中的核心概念——一个主Agent(Orchestrator)负责任务分解和调度,将子任务委托给具有独立上下文窗口的子Agent执行。每个子Agent拥有隔离的上下文意味着它不会被主Agent的其他任务信息所干扰,可以专注于自己的子任务。这种设计借鉴了软件工程中的微服务架构思想——通过职责分离和松耦合来提升系统的可扩展性和可靠性。
这种组合模式构建了一个层次分明的Agent能力体系:MCP解决"数据从哪来"的问题,Skills解决"数据怎么用"的问题,子Agent解决"任务怎么分"的问题。三者协同,形成了一个完整的Agentic架构栈——从数据接入层(MCP)、到能力定义层(Skills)、再到任务编排层(Subagent),每一层都有清晰的职责边界。
课程实战内容
课程设计了由浅入深的四个实战模块:
-
营销Campaign技能:在Cloud AI中创建营销活动技能,并与预构建的Excel和PowerPoint技能结合使用。这一模块展示了Skills在办公自动化场景中的应用——Agent不仅能生成营销文案,还能直接操作Office文档,将创意转化为可交付的商业资产。
-
内容创作与数据分析:创建两个独立的Skills,分别用于内容创作和数据分析工作流,通过Claude API进行调用。这一模块引入了API调用方式,意味着Skills不仅可以在交互式环境中使用,还可以被集成到自动化管道(Pipeline)中,实现无人值守的批量处理。
-
代码审查与测试:在Claude Code中使用Skills进行代码Review和测试。Claude Code是Anthropic推出的命令行AI编程工具,定位为开发者的"终端内AI助手"。与GitHub Copilot等IDE插件不同,Claude Code直接在终端环境中运行,可以读写文件、执行shell命令、管理Git操作,具备完整的系统级交互能力。Skills在Claude Code中的应用尤为自然,因为它本身就具备Skills所需的文件系统访问和命令执行这两个基础工具。
-
研究Agent:使用Claude Agent SDK构建一个研究Agent,利用Skill来整合研究结果。这是最高级的应用场景,涉及Agent SDK的编程接口,开发者可以定义Agent之间的委托关系、通信协议和错误处理策略,构建真正的多Agent协作系统。
这四个模块覆盖了企业级应用中最常见的场景——从办公自动化到软件开发,再到研究分析,展示了Skills的广泛适用性。
总结与展望
这门Agent Skills课程揭示了AI Agent发展的一个重要趋势:从通用能力走向专业化、模块化的能力扩展。Skills作为开放标准的确立,标志着Agent生态正在从各自为战走向互联互通。
对于开发者而言,掌握Skills的构建方法意味着能够将领域专业知识系统化地注入Agent,而不是依赖冗长的Prompt工程。对于企业而言,Skills的可复用性和跨平台兼容性将显著降低Agent部署的边际成本。更深远的影响在于,Skills可能催生一个新的知识经济形态——领域专家可以将自己的专业知识封装为Skills并在市场上流通,就像今天的SaaS应用和API服务一样。
随着MCP、Skills、子Agent等标准化组件的成熟,我们正在见证一个"Agent即平台"时代的到来——每个Agent都可以通过插拔式的能力模块,快速适应不同的业务场景。这与云计算早期从单体应用向微服务架构演进的路径惊人地相似:标准化接口、松耦合组件、按需组合——这些软件工程的经典原则,正在AI Agent领域被重新发现和应用。
核心要点
相关推荐

AI大模型学习路线拆解:三阶段从应用开发到模型微调
深度拆解一条热门AI大模型学习路线,涵盖LangChain应用开发、RAG检索增强生成、Agent智能体、LoRA模型微调等核心技术栈,分析三阶段规划的合理性与局限性,为转型者提供理性参考。

AI Agent智能体开发:六周系统学习路线全解析
从零开始学AI Agent智能体开发,六周系统学习路线涵盖核心架构、ReAct原理、多智能体协作、RAG融合到实战部署,帮你建立完整知识体系,避开常见学习误区。

前端开发者转型AI Agent开发的四大核心优势
前端开发者转型AI Agent开发具备TypeScript生态适配、全栈衔接低门槛、状态管理同构性等核心优势。本文详解前端转AI Agent的可行路径与推荐学习路线。