吴恩达Agent Skills教程:让AI代理学会新技能的完整指南

课程概述
吴恩达(Andrew Ng)联合Anthropic推出了一门全新课程——Agent Skills(代理技能),由讲师Ellie Sherwick主讲。这门课程聚焦于如何为Claude Code等AI代理赋予新的能力,让它们能够更高效地执行各类任务。
吴恩达是全球AI教育领域最具影响力的人物之一,他创办的DeepLearning.AI平台已推出数十门AI课程,覆盖从机器学习基础到前沿应用的完整谱系。Anthropic则是由前OpenAI核心成员Dario Amodei和Daniela Amodei于2021年创立的AI安全公司,其旗舰产品Claude系列模型以安全性和长上下文处理能力著称。两者的合作代表了AI教育与前沿AI产品研发的深度融合,课程内容直接基于Anthropic的最新技术栈,具有极高的实践价值。
Claude Code是Anthropic推出的命令行AI编程工具,允许开发者在终端中直接与Claude模型交互来完成编码任务。与传统的IDE插件不同,Claude Code以终端原生的方式运行,能够直接访问项目文件系统、执行shell命令、运行测试等。它的核心优势在于拥有完整的开发环境感知能力——可以读取整个代码库、理解项目结构、执行构建和测试流程。这种设计哲学与Cursor、GitHub Copilot等IDE内嵌式AI编程工具形成鲜明对比。IDE插件通常在编辑器沙箱内运行,权限受限于当前打开的文件和有限的上下文。而Claude Code作为终端原生工具,继承了Unix哲学中"一切皆文件"的理念,可以直接操作文件系统、调用git命令、运行构建脚本和测试套件。这种设计使其具备了完整的"开发者视角"——不仅能看到代码本身,还能理解项目的构建配置、依赖关系、CI/CD流程等全局信息,从而做出更准确的代码决策。Claude Code本质上就是一个具备文件系统访问和代码执行能力的AI代理,这使它成为Skills技能系统的天然载体。
课程的核心理念很简单:Skills(技能)是一组指令文件夹,通过专业化知识来扩展AI代理的能力边界。 如果你有一个反复让AI代理执行的工作流程,与其每次都从头解释,不如将其打包为一个Skill,让代理自动知道该怎么做。



什么是Agent Skills?
基本结构
Skills的核心是一个标准化的文件结构。每个Skill必须包含一个skill.md的Markdown文件,其中定义了:
- 技能名称:简洁描述这个技能是什么
- 技能描述:说明技能的适用场景
- 主要指令:详细的执行步骤和规则
主要指令还可以引用其他文件,包括脚本、额外的Markdown文件,以及模板和图片等资源文件。
渐进式加载机制
课程中提到了一个关键的设计理念——渐进式披露(Progressive Disclosure)。这意味着技能的名称和描述始终存在于代理的上下文窗口中,但代理不会将其余指令加载到上下文中,直到用户请求与技能描述匹配时才会触发加载。之后,代理可能还会根据需要额外加载引用文件和资源文件。
这里需要理解一个关键概念:上下文窗口(Context Window)是大语言模型在单次交互中能够处理的最大文本长度,通常以Token数量衡量。例如Claude的上下文窗口可达200K tokens,GPT-4 Turbo为128K tokens。尽管窗口越来越大,但上下文空间仍然是稀缺资源——填充过多无关信息会导致模型注意力分散、推理质量下降,同时也增加API调用成本。
渐进式披露最初是人机交互(HCI)领域的设计原则,由IBM研究员在1980年代提出,核心思想是"只在用户需要时才展示复杂信息"。在AI代理的上下文管理中,这一原则被重新诠释为一种资源调度策略。研究表明,即使在200K tokens的超长上下文窗口中,模型对中间位置信息的关注度也会显著下降(即"Lost in the Middle"现象)。因此,精确控制何时加载什么信息,不仅是成本优化,更是保障推理质量的关键工程决策。渐进式披露的设计正是针对这一瓶颈的工程优化策略。
这种设计非常巧妙——它既保证了代理随时"知道"自己拥有哪些技能,又避免了不必要的上下文占用,最大化利用了有限的上下文窗口。
Skills作为开放标准
值得关注的是,Skills现在已经成为一个开放标准(Open Standard)。这意味着它有标准化的格式,可以与任何兼容Skills的代理配合使用。你只需构建一次技能,就能将其部署到多个代理产品中,实现"一次编写,到处运行"。
技术标准的开放化历史上多次引发行业变革。HTML标准使任何人都能创建网页内容,催生了万维网生态;OCI(Open Container Initiative)标准使容器镜像可以在Docker、Kubernetes等不同平台间无缝迁移,推动了云原生革命;OpenAPI(Swagger)规范则统一了REST API的描述格式,极大促进了微服务间的互操作性。Skills开放标准的野心与这些先例一脉相承——通过定义统一的技能描述格式,打破当前AI代理生态中各家平台"围墙花园"式的封闭格局。
当一种技术格式从私有实现变为开放标准时,通常会引发网络效应——更多开发者参与创建内容,更多平台支持该格式,最终形成正向循环的生态系统。在AI代理领域,目前各家的代理工具(如OpenAI的GPTs、Google的Gems)都采用私有格式,技能和配置无法跨平台迁移。Skills开放标准的出现试图打破这种碎片化局面,使技能资产可以在不同代理产品间自由流通。
技能运行的基础工具
要让AI代理使用技能,需要一组基础工具支持:
- 文件系统访问:读写文件的能力
- 批处理工具:执行代码的能力
这些工具使代理能够执行技能所需的任何命令。更强大的是,代理可以将Skills与MCP(Model Context Protocol)和子代理(Subagents)结合,创建强大的代理工作流。
MCP是Anthropic于2024年底推出的开放协议,旨在为AI模型提供与外部数据源和工具交互的标准化接口。可以将MCP理解为AI世界的"USB-C接口"——它定义了一套统一的通信规范,使AI代理能够连接数据库、API、文件系统等各种外部资源,而无需为每个数据源编写定制化的集成代码。MCP的设计灵感来源于语言服务器协议(LSP),后者通过标准化编辑器与语言分析工具之间的通信,使VS Code等编辑器能够支持数百种编程语言而无需为每种语言单独开发插件。MCP将这一思路迁移到AI领域:定义了资源(Resources)、工具(Tools)、提示(Prompts)三种核心原语,分别对应数据读取、操作执行和交互模板。MCP服务器可以用任何编程语言实现,通过JSON-RPC协议与AI客户端通信。目前已有社区开发的MCP服务器覆盖了GitHub、Slack、PostgreSQL、Google Drive等数十种常见服务,极大降低了AI代理与外部世界交互的开发复杂度。
子代理则是一种多代理架构设计模式,主代理将复杂任务分解后委托给专门的子代理执行。每个子代理拥有独立的上下文窗口(即"隔离上下文"),这意味着子代理不会被主代理的全部对话历史所干扰,可以专注于自己的子任务。这种架构类似于软件工程中的微服务思想——通过职责分离和独立运行来提升整体系统的可靠性和效率。Claude Code中的子代理机制允许主代理在需要时启动子代理完成特定工作,完成后将结果汇总回主代理。
值得注意的是,子代理架构虽然带来了职责分离和上下文隔离的优势,但也引入了新的工程挑战。首先是通信开销——主代理与子代理之间的信息传递需要精心设计,既要提供足够的任务上下文,又要避免传递冗余信息。其次是错误传播——子代理的失败如何被主代理感知和处理,需要健壮的错误处理机制。此外,多代理系统的调试和可观测性也比单代理系统复杂得多。业界目前常见的多代理框架包括LangGraph、CrewAI、AutoGen等,各自在编排灵活性、调试工具、人机协作等方面有不同侧重。
三者结合的工作流示例如下:
- 使用MCP从外部数据源获取数据
- 依靠Skill来决定如何处理这些数据或如何高效检索
- 将任务委托给具有隔离上下文的子代理,子代理本身也可以使用Skills获取专业知识
课程内容详细规划
这门课程涵盖了从入门到进阶的完整学习路径:
第一部分:Cloud API + 营销技能
从Cloud API入手,创建一个营销活动技能,并将其与预构建的Excel和PowerPoint技能结合使用。这是一个非常实用的商业场景——自动化营销内容的生成和报告制作。Cloud API(即Anthropic API)是开发者以编程方式调用Claude模型的标准接口,支持文本生成、工具调用、视觉理解等能力。通过API方式使用Skills,开发者可以将技能系统集成到自己的应用程序中,而不局限于Claude Code的命令行环境。
第二部分:内容创作与数据分析
创建两个技能,分别用于内容创作和数据分析工作流,并通过Cloud API进行测试。这一部分展示了Skills在非编程场景中的广泛适用性——无论是撰写营销文案、生成社交媒体内容,还是清洗数据、生成可视化报告,都可以通过标准化的技能定义来实现自动化。
第三部分:代码审查与测试
将Skills与Claude Code结合,用于代码审查和测试场景。这对开发者来说是一个极具吸引力的应用方向。代码审查(Code Review)是软件开发流程中的关键质量保障环节,传统上依赖资深开发者逐行检查代码变更。通过将团队的代码规范、安全检查清单、性能优化准则等编码为Skill,AI代理可以在提交代码前自动执行标准化审查,既提升了审查效率,也确保了规范的一致性执行。
第四部分:研究代理
使用Cloud Agent SDK构建一个研究代理,利用Skill来整合研究结果。Cloud Agent SDK(即Anthropic Agent SDK)是Anthropic提供的Python开发工具包,用于构建基于Claude模型的自主代理应用。它封装了代理循环(Agent Loop)的核心逻辑——模型思考、工具调用、结果处理的迭代过程,开发者只需定义代理的工具集和行为规则即可快速搭建代理系统。
代理循环是所有AI代理系统的核心运行机制,其基本流程为:接收任务→模型推理→决定是否调用工具→执行工具→将结果反馈给模型→继续推理,如此循环直到任务完成或达到终止条件。Anthropic Agent SDK对这一循环进行了工程化封装,开发者可以通过声明式配置定义代理的可用工具、系统提示、安全护栏等。SDK还内置了工具使用的结构化输出解析、重试机制、Token用量追踪等实用功能。与LangChain等通用框架相比,Anthropic Agent SDK与Claude模型深度集成,能够充分利用Claude的工具调用能力和扩展思考(Extended Thinking)特性。这一部分展示了Skills在复杂知识工作中的潜力。
核心价值与行业启示
这门课程揭示了AI代理发展的一个重要趋势:模块化和标准化。Skills本质上是将人类的专业知识和工作流程编码为代理可以理解和执行的标准格式。
这一趋势与软件工程的演进历程高度吻合。从早期的单体应用到面向对象编程,从组件化开发到微服务架构,软件工程一直在追求更高层次的模块化和可复用性。Skills可以被视为AI代理领域的"软件包管理"——正如npm之于JavaScript、pip之于Python,Skills标准有望催生一个AI技能的分发和管理生态。开发者可以发布自己创建的技能,其他人可以直接安装使用,无需理解底层实现细节。
对于开发者和AI从业者而言,这意味着:
- 复用性:好的技能可以在不同项目和产品间共享
- 可组合性:多个技能可以组合产生更强大的能力
- 生态效应:开放标准将催生技能市场和社区
随着Skills成为开放标准,我们可能会看到一个类似"插件商店"的技能生态系统出现,让AI代理的能力可以像乐高积木一样自由组合和扩展。这对于降低AI应用的开发门槛、加速AI在各行业的落地都有重要意义。从更宏观的视角来看,Skills标准的出现标志着AI代理正在从"通用对话工具"向"可编程的专业化工作平台"演进——这与软件工程从单体应用走向微服务、从封闭系统走向开放生态的历史路径高度一致。
值得关注的是,Skills标准的成功与否将取决于几个关键因素:首先是社区采纳度——是否有足够多的代理平台愿意支持这一标准;其次是技能质量——早期高质量技能的数量将直接影响开发者的使用意愿;最后是治理机制——如何确保技能的安全性、版本兼容性和质量标准,都需要完善的社区治理框架。这些挑战与开源软件生态面临的问题如出一辙,但AI代理的自主执行特性使安全性问题尤为突出——一个恶意技能可能导致代理执行危险操作,因此技能的审核和信任机制将是生态建设的重中之重。
核心要点
核心要点
相关推荐

AI+Java后端学习路线:四阶段从CRUD到高级AI工程师
一套完整的AI+Java后端进阶学习路线,基于Spring AI Alibaba框架,从提示词工程、大模型API集成、RAG知识库到Agent系统,四个阶段帮助Java后端开发者系统掌握AI工程能力,进阶大厂核心岗位。

Agent Middleware机制:为模型调用加装拦截器
深入讲解AI Agent中间件机制的工作原理,通过日志记录和安全检查两个实战案例,掌握Middleware的旁观者与守门人两种角色设计模式,构建可扩展的生产级Agent。

SFT无法修复JSON错误的根因:GRPO正确性训练如何突破编码Agent瓶颈
深入分析为什么监督微调(SFT)无法解决编码Agent的JSON格式错误问题,以及GRPO(群组相对策略优化)如何通过二元奖励信号和推理权重同步机制,直接针对输出正确性训练,实现从"几乎正确"到"完全正确"的跨越。