GitHub 7万星：提示工程、RAG与AI Agent最全开源学习指南

项目概览：74K Star 的提示工程百科全书

在大语言模型（LLM）快速迭代的今天，如何高效地与AI对话、构建智能应用，已经成为开发者和研究者绑定的必修课。大语言模型（Large Language Model）是基于 Transformer 架构、通过海量文本数据预训练而成的深度学习模型，代表性产品包括 OpenAI 的 GPT 系列、Google 的 Gemini、Anthropic 的 Claude 以及 Meta 的 LLaMA 等。这些模型本质上是"下一个 Token 预测器"，其输出质量高度依赖于输入的质量和结构——这也是为什么提示工程被称为"与 AI 对话的艺术与科学"。

GitHub 上的 dair-ai/Prompt-Engineering-Guide 项目，凭借超过 74,000 颗 Star 和 8,000+ 次 Fork，稳居提示工程（Prompt Engineering）领域最权威的开源资源库。

这个项目由 DAIR.AI 社区维护。DAIR.AI（Democratizing Artificial Intelligence Research）是一个致力于让 AI 研究和教育资源民主化的开源社区，由机器学习研究者 Elvis Saravia 发起，核心理念是降低 AI 学习门槛，将前沿学术研究转化为易于理解和实践的开源资源。项目内容覆盖从基础提示工程到前沿的上下文工程（Context Engineering）、检索增强生成（RAG）以及 AI Agent 等多个核心方向，为不同水平的学习者提供了一条清晰的系统化学习路径。

github source: dair-ai/Prompt-Engineering-Guide: 🐙 Guides, papers, lessons, notebooks and resources for prompt engi

提示工程核心技巧详解

提示工程是整个项目的基石。它远不止"写好一段提示词"那么简单——这是一套系统化的方法论，涉及如何设计、优化和迭代与 LLM 交互的输入，从而获得更精准、更可靠的输出。

项目收录了大量经过实践验证的提示技巧：

零样本提示（Zero-shot Prompting）：无需示例，直接让模型完成任务。这种方式依赖模型在预训练阶段习得的通用知识，适用于模型已经充分"见过"的任务类型。
少样本提示（Few-shot Prompting）：通过少量示例引导模型理解任务模式。研究表明，即使只提供 2-5 个示例，模型在特定任务上的表现也能显著提升，这种能力被称为"上下文学习"（In-Context Learning）。
思维链提示（Chain-of-Thought）：引导模型逐步推理，显著提升复杂任务的准确率。这一技术由 Google Brain 团队的 Jason Wei 等人在 2022 年正式提出，研究发现仅仅在提示中加入"Let's think step by step"这样的引导语，就能让大模型在数学推理、常识推理等任务上的准确率提升 20%-60%。这一发现深刻改变了人们对 LLM 能力边界的认知——模型并非不具备推理能力，而是需要正确的"激活方式"。后续衍生出的 Tree-of-Thought（思维树）、Graph-of-Thought（思维图）等方法进一步拓展了这一研究方向。
自我一致性（Self-Consistency）：通过多次采样和投票机制提高输出可靠性。该方法由 Xuezhi Wang 等人提出，核心思想借鉴了集成学习（Ensemble Learning）中的投票机制——对同一个问题，通过设置较高的温度参数（Temperature）让模型生成多条不同的推理路径，然后对所有推理路径的最终答案进行多数投票，选择出现频率最高的答案作为最终输出。在 GSM8K 等数学推理基准测试中，这种方法将准确率提升了 10% 以上。

这些技术并非孤立存在。项目将它们串联成一个完整的知识体系，帮助学习者从入门逐步走向精通。

从 Prompt Engineering 到上下文工程

项目已经将视野扩展到了**上下文工程（Context Engineering）**这一更前沿的概念。随着大模型上下文窗口不断扩大——从 4K 到 128K 甚至百万级 Token——如何有效地组织和管理输入给模型的上下文信息，其重要性已经超过了单纯的提示词设计。

上下文窗口（Context Window）指模型单次能够处理的最大 Token 数量。GPT-3 时代的上下文窗口仅有 2,048 个 Token（约 1,500 个英文单词），而到了 2024-2025 年，Google Gemini 已支持百万级 Token 的上下文窗口，Claude 支持 200K Token，GPT-4 Turbo 支持 128K Token。这一飞跃得益于多项关键技术突破：包括 ALiBi（Attention with Linear Biases）位置编码、RoPE（Rotary Position Embedding）的外推扩展、Flash Attention 等高效注意力计算算法，以及 Ring Attention 等分布式长序列处理技术。当你可以一次性输入一整本书的内容时，"放什么进去"和"怎么组织"就变得比"怎么问"更加关键。

上下文工程关注的核心问题包括：

在有限的上下文窗口中，如何筛选最相关的信息
如何组织信息的层次结构
如何平衡不同类型的上下文（系统指令、用户历史、检索结果等）

这些策略的目标只有一个：最大化模型的输出质量。上下文工程代表了提示工程的自然演进方向，也是当前业界讨论的热点。

RAG 检索增强生成：让大模型拥有实时知识

检索增强生成（Retrieval-Augmented Generation，RAG） 是项目重点覆盖的另一个关键领域。RAG 的核心架构由 Meta AI（原 Facebook AI Research）的 Patrick Lewis 等人在 2020 年的论文中首次提出，通过将外部知识库与大模型结合，有效解决了 LLM 的知识截止日期和幻觉问题，是当前企业级 AI 应用中最主流的架构模式之一。

RAG 的工作流程分为三个阶段：首先，将外部知识库中的文档通过嵌入模型（Embedding Model）转化为向量并存储在向量数据库（如 Pinecone、Weaviate、Milvus 等）中；其次，当用户提出问题时，系统将问题同样转化为向量，通过相似度检索找到最相关的文档片段；最后，将检索到的文档片段与用户问题一起作为上下文输入给 LLM 生成最终回答。所谓"幻觉"（Hallucination），是指 LLM 生成看似合理但实际上不正确或无中生有的内容，这是由模型的概率生成本质决定的。RAG 通过为模型提供可靠的外部证据来"锚定"生成内容，显著降低了幻觉发生率。

项目提供了 RAG 相关的论文解读、实践指南和 Notebook 示例，帮助开发者理解从基础 RAG 到高级 RAG 的完整技术栈。高级 RAG 技术中，查询改写（Query Rewriting）通过重新表述用户问题来提升检索质量，重排序（Re-ranking）使用交叉编码器对初步检索结果进行精细化排序，多步检索（Multi-hop Retrieval）则支持需要综合多个文档才能回答的复杂问题。对于正在落地 RAG 方案的团队来说，这部分内容具有很高的参考价值。

AI Agent：迈向自主智能的下一步

AI Agent（智能体）是项目覆盖的最前沿方向。Agent 不再是简单的问答系统，而是能够自主规划、调用工具、执行多步任务的智能系统。项目收录了相关的研究论文、架构设计和实践资源，为构建下一代 AI 应用提供了扎实的理论和实践基础。

从 ReAct 框架到工具调用（Tool Use），从多 Agent 协作到记忆管理，这部分内容紧跟学术界和工业界的最新进展。ReAct（Reasoning + Acting）框架由普林斯顿大学和 Google Brain 在 2022 年联合提出，是当前 AI Agent 最重要的基础架构之一。其核心创新在于将"推理"和"行动"交织在一起：Agent 先通过思考（Thought）分析当前状态和下一步计划，然后执行具体动作（Action）如调用搜索引擎、执行代码或查询数据库，再根据观察到的结果（Observation）进行下一轮推理。这种"思考-行动-观察"的循环使 Agent 能够动态调整策略，处理开放式的复杂任务。

在此基础上，工具调用（Tool Use / Function Calling）技术允许 LLM 以结构化的方式调用外部 API 和工具，多 Agent 协作（Multi-Agent）让多个具有不同专长的 Agent 协同完成复杂任务，记忆管理（Memory Management）则赋予 Agent 短期工作记忆和长期经验积累的能力。当前主流的 Agent 开发框架包括 LangChain、LlamaIndex、AutoGen 和 CrewAI 等，这部分内容是了解 Agent 技术全貌的优质入口。

项目特色与学习价值

多维度学习资源覆盖

项目采用 MDX 格式组织内容，提供了多种学习形式。MDX 是 Markdown 与 JSX（React 的语法扩展）的结合体，允许在 Markdown 文档中直接嵌入 React 组件，这意味着文档不仅可以包含静态文本和代码块，还能嵌入交互式图表、可运行的代码沙盒、动态数据可视化等富交互元素。项目基于 Nextra（一个基于 Next.js 的文档框架）构建，利用 MDX 的能力实现了兼具阅读体验和交互性的技术文档站点。

具体的学习形式包括：

指南文档（Guides）：系统化的知识讲解，适合建立整体认知
论文解读（Papers）：前沿研究的深度分析，适合追踪学术进展
课程内容（Lessons）：结构化的学习路径，适合按部就班地学习
交互笔记本（Notebooks）：可直接运行的代码示例，适合动手实践

无论偏好理论学习还是代码实操，都能找到合适的切入点。

社区驱动保证内容时效性

超过 8,000 次 Fork 背后是一个庞大的贡献者社区。项目能够紧跟 AI 领域的快速发展节奏，及时纳入最新的技术和研究成果。在知识更新速度极快的 AI 领域，这种社区驱动的模式是内容保持时效性和全面性的关键保障。

谁适合学习这个项目？

AI 应用开发者：系统掌握提示工程技巧，构建更稳定可靠的 LLM 应用
产品经理和设计师：理解 AI 能力边界，设计更合理的人机交互体验
研究人员：跟踪提示工程、RAG 和 Agent 领域的最新学术进展
AI 初学者：从零开始建立对大模型应用开发的系统认知

总结

dair-ai/Prompt-Engineering-Guide 早已不只是一个提示词技巧集合。它已经演变为一个覆盖提示工程、上下文工程、RAG 和 AI Agent 的综合性学习平台。在大模型应用日益普及的当下，掌握这些核心技能已经从"加分项"变成了"必备项"。

无论你处于 AI 学习的哪个阶段，这个项目都值得收藏并深入研读。