Grill Me技能：让AI拷问你，快速提取隐性知识提升项目效率

核心理念：上下文质量决定AI输出质量

当所有人都在使用同一个模型（比如Claude Opus 4），用相同的提示词自然会得到相同的输出。真正的差异点不在于模型本身，而在于你给模型注入的上下文——你的审美、语气、决策逻辑。

这一理念在AI领域被称为"上下文工程"（Context Engineering）。与传统的提示词工程（Prompt Engineering）不同，上下文工程关注的不仅是单次对话的提示词设计，而是如何系统性地构建、管理和优化输入给大语言模型的全部信息——包括系统提示词、历史对话、外部知识库、用户偏好档案等多层次信息的组织。当两个人使用同一个模型但得到截然不同的结果时，差异往往就在于上下文的丰富度和精确度。

这位创作者花了数月时间，将所有知识沉淀到他称之为"AiOS"的系统中。他发现最大的挑战始终是信息提取：如何把头脑中的隐性知识系统化地塞进AI系统，让技能调用它并持续优化上下文质量。

隐性知识（Tacit Knowledge）的概念最早由哲学家迈克尔·波兰尼提出，指那些难以用语言明确表达的经验性知识——比如一个资深设计师对"好看"的直觉判断，或一个运营专家对用户行为的预判。我们每个人都拥有大量这样的知识，但当被问到"你是怎么做决策的"时，往往说不清楚。将这类知识系统化提取并编码为AI可理解的格式，是当前AI应用落地的核心难题之一。

这就引出了今天的主角——**Grill Me（拷问模式）**技能。

这个头脑风暴文件夹

比如95%左右的水平

将AI应用到我的内部业务中

什么是Grill Me技能

起源与核心逻辑

Grill Me最初由Matt Pocock开发。Matt是TypeScript社区知名的教育者和开发者，以其TypeScript教程和开源贡献闻名。他开发这个技能的背景是AI辅助编程工具（如Claude Code、Cursor、GitHub Copilot）的快速普及——这些工具改变了开发者的工作方式，但也暴露了一个关键问题：AI生成的代码质量高度依赖于需求描述的精确度。

Grill Me本质上是一个极其简单的提示词，只有4-5句话：

就这个计划的每个方面持续拷问我，直到我们达成共识
沿着决策树的每个分支深入挖掘
逐个解决决策之间的依赖关系
每个问题都要提供你的推荐答案
一次只问一个问题
如果问题可以通过查看代码库解决，就直接去查代码库

其中"沿着决策树的每个分支深入挖掘"借鉴了决策科学中的决策树分析方法。决策树是一种将复杂决策分解为一系列二元或多元选择的结构化工具，每个节点代表一个决策点，每个分支代表一种可能的选择路径。在AI系统中，这种结构化的知识表示方式与知识图谱（Knowledge Graph）有异曲同工之妙——都是将零散的信息组织成有逻辑关系的网络结构，使AI能够沿着关系链进行推理和检索。

这个设计的精妙之处在于：技能不一定要是超级复杂的自动化流程，它可以只是一个你不想每次都重复输入的提示词。 从本质上看，Grill Me是一种"需求引导"工具，通过苏格拉底式提问法（Socratic Method）帮助用户将模糊的想法转化为精确的规格说明。苏格拉底式提问的核心不是给出答案，而是通过层层追问帮助对方自己发现答案中的漏洞和矛盾。

它解决了什么问题

很多人可能觉得"花5分钟把想法倒进Claude Code就够用了"，但实际上从来都不够用。Grill Me的作用是持续不断地向你提问，拷问你直到完全掌握整个流程的每个细节。这就是95%成功率系统和80%成功率系统的区别。

特别是在服务客户时，你需要不断追问流程细节，追问到对方可能烦躁的程度。这恰恰是必须做的——而Grill Me让AI来扮演这个"烦人的追问者"角色。人类在社交场景中往往会因为顾及对方感受而停止追问，但AI没有这个心理负担，它可以不知疲倦地深入每一个细节，直到信息完全穷尽。

改进版Grill Me：加入检查点机制

为什么需要检查点

原版Grill Me有一个问题：如果你在对话中被连续拷问一个小时以上（这种情况确实会发生），随着上下文窗口逐渐填满，AI可能会记错你之前的回答。

这里涉及到大语言模型的一个重要技术限制。上下文窗口（Context Window）是模型一次能处理的最大文本长度，以Claude为例，其上下文窗口可达200K tokens（约15万字）。虽然窗口很大，但研究表明模型存在"中间遗忘"（Lost in the Middle）现象——当上下文过长时，模型对中间部分信息的注意力会显著下降，更倾向于记住开头和结尾的内容。这意味着在一个长达数万字的对话中，你在第15分钟给出的关键回答可能在第50分钟时被模型"遗忘"或混淆。

创作者发现自己会手动告诉AI"把这个写到文档里"，每次都做个检查点。于是他将这个功能直接整合到技能中。

改进版的工作流程

改进后的Grill Me技能会：

自动创建头脑风暴文件夹：放在项目根目录下
生成Markdown文件：包含关键决策、完整问答步骤、提问日志、回答记录和关键要点
设置发现笔记：总结关键决策、问答日志以及开放标记
标记知识盲区：当发现你无法完全解释某个流程时，系统会标记出需要去联系相关干系人获取信息的内容

每回答一个问题后，AI会建立检查点，把所有内容写回知识文档，然后继续循环，直到知识文档足够完善、没有任何知识漏洞为止。

这种检查点机制本质上是一种"外部记忆"策略，类似于RAG（检索增强生成，Retrieval-Augmented Generation）架构中的知识库更新机制。RAG是当前AI应用中最主流的架构之一，其核心思想是让模型在生成回答时能够检索外部知识库，而不是仅依赖训练时学到的参数化知识。Grill Me的检查点机制将对话中产生的新知识实时写入外部文档，确保即使对话超出模型的有效注意力范围，关键信息也不会丢失。

效率提升的数学逻辑

传统迭代 vs Grill Me迭代

创作者用一个简单的图示说明了效率差异：

传统方式：

第一次迭代：成功率约70%
每次小改进：提升约5%
需要10-30次迭代才能达到95%的稳定水平

使用Grill Me：

第一次迭代：因为充分准备，直接跃升到约90%
仍需少量迭代，但能更快达到目标
有更多机会找到更优的迭代路径

这种效率差异可以用软件工程中经典的"缺陷成本曲线"来理解。IBM的系统科学研究所早在1980年代就发现，在需求阶段发现并修复一个缺陷的成本是1x，而在设计阶段是5x，在编码阶段是10x，在测试阶段是15x，在生产环境中则高达100x。Grill Me本质上是将"需求验证"前置到项目最早期，通过穷尽式提问确保需求的完整性和一致性。这与敏捷开发中的"Spike"（技术探针）和精益创业中的"假设验证"理念一脉相承——都是用低成本的早期探索来避免高成本的后期返工。

这让人想起那个经典比喻："如果我有6小时砍树，会花4小时磨斧头。"前期准备确实可能枯燥又重复，但这是获取完整背景的必要过程，能大幅提升后续流程的效率。

实际应用场景

持续进化的知识库

创作者展示了一个实际案例：当关于"包装"的拷问环节结束时，AI主动提出"我注意到你有包装指南和包装技能，但我们讨论过的很多细节都没有包含在里面，要不要更新？"这种主动发现知识缺口的能力，让整个系统持续进化。

他还做过一次全面的业务梳理："我希望你全面了解这个业务的所有细节"，然后从头到尾梳理了所有决策和流程。结果是整个操作系统更了解业务运作方式了。

这种"知识库持续进化"的模式，在知识管理领域被称为"活文档"（Living Document）策略。与传统的一次性文档编写不同，活文档随着业务发展和新信息的获取而持续更新。结合AI的主动检测能力，系统能够自动识别现有文档与实际操作之间的差距，形成一个正反馈循环：使用越多→发现越多知识缺口→补充越完善→AI输出质量越高→使用越多。

灵活的使用方式

可以问5个问题，也可以问30个，直到双方觉得达到了相同的知识储备
所有内容保存为文档，可随时查阅和更新
当有重大突破时，可以回到文档说"再考考我，这是我发现的新东西"

关键启示：前期投入换取长期回报

创作者坦言，他认为技能永远达不到100%完美，因为随着业务发展和个人成长，技能也在持续进化。他用了好几个月的技能现在依然在频繁调整。

但核心思路很明确：**与其在后期反复修补，不如在前期投入时间做充分的知识提取。**Grill Me技能正是实现这一目标的高效工具——它把"向自己提问"这个本该由人主动完成的动作，变成了AI驱动的系统化流程。

从更宏观的视角来看，Grill Me代表了人机协作的一种新范式：AI不再只是被动的执行者，而是主动的知识引导者。它利用了AI的两个独特优势——不知疲倦的耐心和系统化的思维结构——来弥补人类在知识外化过程中的天然弱点（容易遗漏、表述模糊、缺乏系统性）。这种"AI作为思维教练"的模式，可能会成为未来知识工作者的标配工具。

对于任何想要构建AI辅助工作流的人来说，这个简单却强大的技能值得立即尝试。