AI Agent开源课程：36章从ReAct到Claude Code全栈实战指南

项目概览：36章可运行的AI Agent全栈课程

AI Agent开发的学习资源不少，但真正系统化、可运行、面向实战的课程并不多见。GitHub上的开源项目 agent-study 提供了36章完整的AI Agent全栈课程，覆盖从基础的ReAct循环到前沿的Claude Code逆向工程，所有章节均以可运行的Python文件呈现，并明确以面试为导向。

项目主页

该项目由开发者 Callous-0923 创建，目前已获得265颗Star。虽然体量不算庞大，但课程设计的系统性和实用性让它在AI Agent学习资源中独树一帜。

课程核心模块深度解析

ReAct循环：理解AI Agent的核心思维模式

课程从AI Agent最核心的设计模式——ReAct（Reasoning + Acting）循环讲起。ReAct是当前主流Agent框架的理论基石，它让大语言模型能够交替进行"思考"和"行动"，通过观察环境反馈来迭代完成复杂任务。

ReAct模式最早由Yao等人在2022年发表的论文《ReAct: Synergizing Reasoning and Acting in Language Models》中正式提出。其核心洞察在于：纯粹的"链式思考"（Chain-of-Thought）推理缺乏与外部环境的交互能力，而纯粹的行动序列又缺乏内部推理支撑。ReAct将两者结合，形成"思考→行动→观察"的闭环迭代。在实现层面，每一轮循环中，LLM生成一段自然语言推理（Thought），随后输出结构化的工具调用指令（Action），执行后将结果作为新的上下文（Observation）注入下一轮推理。这一机制使Agent能够处理需要多步骤、多工具协作的复杂任务，例如网页搜索+计算+代码执行的组合场景。LangChain、LlamaIndex等主流框架的Agent模块均以ReAct为默认执行范式。

理解ReAct循环，就是理解Agent与普通LLM调用的本质区别：Agent不是一次性生成答案，而是在循环中不断推理、执行工具调用、观察结果、再推理，直到任务完成。课程中的可运行代码让你能亲手构建一个最小化的Agent循环，从代码层面吃透这一核心概念。

Claude Code逆向工程：拆解顶级Agent的设计思路

课程中最有特色的部分之一是对Claude Code的逆向分析。Claude Code是Anthropic推出的编程Agent，被广泛认为是当前最强大的AI编程助手之一。通过逆向工程的方式研究其内部设计，学习者可以深入理解：

顶级Agent产品如何设计系统提示词
工具调用的编排策略和错误恢复机制
上下文管理和对话状态维护的工程实践

这种"从产品反推设计"的学习方式，比单纯阅读文档更能培养真正的工程直觉。

MCP与A2A协议：Agent互联互通的标准化方案

MCP（Model Context Protocol） 和 A2A（Agent-to-Agent） 是2024-2025年Agent生态中最重要的两个协议标准。

MCP于2024年11月由Anthropic正式开源，其设计借鉴了LSP（Language Server Protocol）的成功经验——LSP通过标准化编辑器与语言服务器的通信，彻底改变了IDE生态。MCP同样采用客户端-服务器架构：MCP Server封装具体的工具或数据源（如文件系统、数据库、API），MCP Client（通常是LLM应用）通过标准化JSON-RPC协议与之通信。这意味着开发者只需实现一次MCP Server，即可被所有支持MCP的AI应用复用，打破了此前各家框架工具集互不兼容的碎片化困境。截至2025年，已有数百个官方和社区MCP Server覆盖主流开发工具链，包括GitHub、Postgres、Slack等，形成了类似npm生态的工具市场。

A2A协议由Google于2025年4月发布，旨在解决MCP未覆盖的场景：当任务需要多个专业化Agent协同完成时，Agent之间如何发现彼此、协商能力、安全传递任务。A2A引入了"Agent Card"概念——每个Agent发布一份结构化的能力声明文档，描述自己能处理的任务类型、输入输出格式和认证要求，类似于微服务架构中的API契约。在执行层面，A2A支持长时间运行的异步任务和流式响应，适合编排复杂的多Agent工作流。MCP与A2A形成互补：MCP解决Agent与工具/数据的连接问题，A2A解决Agent与Agent的协作问题，两者共同构成Agent互联互通的完整标准栈。

课程将这两个协议纳入教学体系，反映了作者对行业趋势的准确判断。掌握MCP和A2A协议，对于构建可扩展、可互操作的Agent系统至关重要。

RAG与DSPy：检索增强生成与程序化提示优化

RAG（检索增强生成）已经成为企业级AI应用的标配技术。课程不仅覆盖基础的RAG流水线搭建，还引入了DSPy这一前沿框架。

DSPy（Declarative Self-improving Python）由斯坦福大学Omar Khattab等人于2023年提出，其核心思想是将LLM程序的"结构"与"参数"分离。开发者用声明式语法定义程序逻辑（如"给定问题，先检索相关文档，再生成答案"），而具体的提示词模板和少样本示例则由DSPy的优化器（Teleprompter）自动搜索和编译生成。这一范式的革命性在于：它将提示工程从依赖人类直觉的手工艺转变为可度量、可优化的工程问题。DSPy内置多种优化算法，包括BootstrapFewShot、MIPRO等，能够在给定评估指标下自动找到最优的提示配置。对于Agent系统而言，DSPy尤其适合优化多步骤推理链路，因为它能够端到端地优化整个Pipeline，而非孤立地调整单个提示词。

将DSPy纳入AI Agent课程是一个很有前瞻性的选择——它代表了从"提示工程"到"提示编程