Token Maxing：YC CEO用AI实现400倍编程效率的方法论

从Gary's List开始：重新成为Builder

YC（Y Combinator）是全球最具影响力的创业加速器，成立于2005年，已孵化Airbnb、Stripe、Dropbox、Reddit等独角兽企业，累计投资超过4000家公司，总估值超过6000亿美元。Gary Tan于2023年接任YC CEO，此前他是YC合伙人，也是Initialized Capital的联合创始人。他本人是工程师出身，曾在Palantir担任设计工程师，后联合创办了博客平台Posterous（2012年被Twitter收购）。这种"工程师转投资人再转回Builder"的身份弧线，使他对AI编程工具的实践具有独特的可信度。

Gary Tan在停止编码13年后，借助AI工具在几个月内完成了数十万行代码的产出，构建了多个热门开源项目（GitHub星标超10万）。他将这种方法论称为"Token Maxing"——通过大量消耗AI token来最大化产出价值。这期Light Cone特别节目详细揭示了他的工作流程和思维框架。

Token是大语言模型处理文本的基本计量单位，大约每个英文单词对应1-1.5个token，中文字符通常对应2-3个token。主流AI服务按token消耗量计费，GPT-4级别模型每百万token的成本在5-30美元之间。Gary所倡导的"Token Maxing"理念本质上是一种成本-价值重新定价：传统软件开发中，工程师的时间是最稀缺的资源；而在AI时代，token成本极低但产出密度极高，使得"用钱换时间"的经济逻辑发生了根本性逆转。

Gary Tan的回归始于一个政治倡导项目——Gary's List。他关心旧金山公立学校的代数教育问题，想要建立一个研究性新闻平台。这个项目本质上不只是一个博客平台，而是一个能完成高质量调查记者工作的AI系统。

这个平台的核心能力在于"沸腾海洋"（Boil the Ocean）的理念：不满足于一个信息源，而是同时调用Perplexity API、X的API、Grok API等多个渠道，获取20个以上的信息源进行交叉验证。系统能识别出13个来源支持某观点而7个来源持反对意见，然后将所有上下文喂入核心提示词，做出比人类仅凭点击链接、阅读标题更好的判断。

Gary Tan谈论Token Maxing理念

关键数据对比令人震撼：Gary's List这个全功能博客平台，第一次构建花了400万美元、6-7人、一年半时间；第二次花了10万美元、2人、3个月；而这次仅花了200美元（Claude Code Max账户155美元）和5天时间。

G-Stack诞生：从重复操作到系统化AI编程工作流

G-Stack是Gary在构建项目过程中自然演化出的工具集。他发现自己反复在Claude Code中输入相同的指令，于是把这些常用模式整理成了技能（Skills），形成了一套可复用的AI编程框架。

其中最核心的两个技能：

Plan-Eng-Review（工程审查计划）：要求Claude在开始编码前先制作ASCII图表——数据流、状态机、依赖图、处理管道、决策树。这个简单的步骤让模型加载了完整上下文，从而更完整地执行任务。

CEO Plan（CEO计划）：借鉴Brian Chesky的"10星体验"理念，包含一个"10x检查"——什么方案能以仅2倍的努力交付10倍的价值？这个仅两句话的提示词却能解锁惊人的创造力。

Claude Code与Codex协作工作流

日常工作流：15个AI Agent并行运作

Claude Code是Anthropic推出的命令行AI编程工具，深度集成于终端环境，擅长理解大型代码库的整体架构、进行多文件协调修改，以及处理需要长上下文推理的复杂任务。OpenAI Codex则是专门针对代码生成优化的模型系列，其后代能力已融入GitHub Copilot等产品。Gary将两者定位为互补关系：Claude负责"CEO级"的战略规划与架构决策，Codex则作为"非语言CTO"专注于精确的bug检测与代码审查。这种多模型协作策略规避了单一模型的盲点，类似于软件工程中的"四眼原则"（four-eyes principle）。

Gary的实际工作方式是通过Conductor（一个任务编排工具）来管理多个AI代理。他的典型流程是：

用CEO Skill构思功能方向
用Eng Skill确保测试覆盖完善
在Plan模式下完成详细规划
点击Approve让Claude执行编码
用Codex做交叉验证（他称之为"200 IQ的非语言CTO"）

他在48小时内提交了13个PR，同时排队等待的功能多达15个。当手动QA成为瓶颈时，他直接让Claude Code封装Microsoft Playwright构建了自动化浏览器测试系统。

Microsoft Playwright是2020年发布的开源浏览器自动化框架，支持Chromium、Firefox和WebKit三大浏览器引擎，被广泛用于端到端（E2E）测试，是Selenium的现代替代品。Gary让Claude Code自动封装Playwright构建测试系统，体现了AI编程的一个关键模式：将"元编程"（编写能生成代码的代码）与AI结合，使得测试基础设施的搭建成本从数天压缩到数小时。这也印证了"当某个环节成为瓶颈时，直接用AI自动化它"的工程哲学。

Thin Harness与Fat Skills：AI编程的架构哲学

从Stack Overflow到AI编程的演进

Gary提出了"薄框架、厚技能"（Thin Harness, Fat Skills）的架构理念。Harness（框架）是接收用户输入、传递给LLM、执行工具调用的核心循环——这部分应该尽可能薄。而Skills（技能）则是用Markdown编写的详细指令——这部分应该尽可能厚。

他用婚礼策划做类比：用Markdown写下"如何举办婚礼"的清单（这是LLM擅长处理的模糊、通用场景），而"打电话给20个场地"这种确定性操作则用代码实现（比如调用Twilio API）。

核心洞察在于潜在空间（Latent Space）的概念：潜在空间是深度学习中的核心概念，指神经网络在高维数据中学习到的压缩表示空间。对于大语言模型而言，潜在空间意味着模型在训练过程中内化了人类语言、逻辑、常识和领域知识的抽象表示。代码是脆性的，只能处理被显式编程的情况，不理解特殊情况；而LLM的潜在空间使其能理解你是谁、你的动机是什么，具备泛化到未见场景的能力——这正是"Fat Skills用Markdown写而非用代码写"的底层逻辑。工程师的核心能力变成了判断哪些逻辑放在LLM侧，哪些放在代码侧。