Anthropic源码泄露：未发布模型代号与隐藏功能深度解析

事件起因：一个调试文件引发的连锁反应

Anthropic近日遭遇了一次意外的源码泄露事件。Claude Code作为NPM包发布时，编译过程中意外包含了一个Source Map调试文件——这个文件包含了完整的、人类可读的原始源代码。

Source Map是JavaScript开发中的一种标准调试工具，它建立了编译/压缩后代码与原始源代码之间的映射关系。现代JavaScript项目通常会经过TypeScript编译、代码混淆、Tree Shaking等多道构建工序，最终产出的代码与开发者编写的原始代码差异巨大。Source Map文件（通常以.map为后缀）保存了这种对应关系，使开发者在调试器中能看到原始代码。NPM（Node Package Manager）是JavaScript生态最大的包管理平台，拥有超过200万个公开包。发布NPM包时，开发者需要通过.npmignore或package.json的files字段来控制哪些文件被包含在发布产物中。如果构建流程配置不当，Source Map文件很容易被意外打包进去——这正是此次泄露的技术根源。

有人对其执行了一条简单的ls命令，整个代码库便暴露无遗：插件、内部工具、钩子函数、架构设计，全部一览无余。

Anthropic源码泄露事件

更令人意外的是，这个Source Map文件自Claude Code发布以来已经在NPM注册表中静静躺了约3个月，却无人发现。当AI社区开始深入挖掘后，一系列Anthropic显然不打算公开的内容浮出水面：未发布的模型代号、尚不存在的版本号，以及一套读起来更像间谍小说的"卧底模式"指令。

卧底模式：Claude被要求隐藏AI身份

泄露代码中最引人注目的发现之一，是一个名为getUndercoverInstructions的函数。当Claude Code在公开的开源仓库中运行时，该函数会被激活，其指令内容令人瞠目：

像人类开发者一样编写commit信息
不要提及自己是AI
不要引用Claude Code
不要包含任何内部模型名称
不要留下任何暴露AI参与的co-authored署名

代码注释中甚至直白地写道："Do not blow your cover"（不要暴露你的身份）。被要求隐藏的信息清单本身就很有料——包括内部模型名称如Capybara和Tengu、未发布的版本号如Opus 4.7和Sonnet 4.8、内部仓库名、Slack频道以及内部工具引用。

这说明Anthropic一直在用Claude来帮助构建Claude本身，这在行业中并不罕见——这种做法通常被称为"dogfooding"（吃自己的狗粮），即公司内部率先使用自己的产品。但将"隐藏AI痕迹"的指令直接写入产品代码中，尤其是在他们以企业级专业开发工具定位销售Claude Code的背景下，这就是另一个层面的问题了。

Anthropic由前OpenAI研究副总裁Dario Amodei和Daniela Amodei于2021年创立，公司以"AI安全"为核心品牌叙事，强调负责任的AI开发。其旗舰产品Claude系列模型以"有帮助、无害、诚实"（Helpful, Harmless, Honest，简称HHH）为设计原则。Claude Code于2025年初推出，定位为面向专业开发者的AI编程工具，直接与GitHub Copilot、Cursor等产品竞争。Anthropic已获得包括Google、Amazon在内的超过70亿美元融资，估值超过600亿美元。在这一背景下，"卧底模式"的发现尤为敏感——一家以透明度和AI安全为品牌基石的公司，却在产品代码中嵌入了指示AI隐藏身份的指令，这种矛盾直接触及了AI行业关于透明度和信任的核心议题。

不让AI在公开commit历史中留下痕迹有其合理性，但"卧底模式""关键任务""不要暴露身份"这样的措辞，确实在开发者社区引发了广泛讨论。

未发布模型曝光：内部路线图远超公众预期

Capybara：百万Token上下文的下一代模型

代码中最重磅的发现是代号为Capybara（内部也称为Mythos）的下一代模型。根据泄露代码揭示的信息：

拥有100万Token的上下文窗口
提供两种模式：常规版本和快速模式（代码中标注为capybara-v2-fast）
内部已迭代到第8个版本——不是v1，不是v2，而是v8

上下文窗口（Context Window）是大语言模型的核心参数之一，它决定了模型在单次推理中能同时"看到"和处理的文本总量。Token是模型处理文本的基本单位，英文中1个Token大约对应4个字符或0.75个单词，中文中1个Token通常对应1-2个汉字。100万Token的上下文窗口意味着模型可以在单次对话中处理约75万个英文单词——相当于10-15本完整的技术书籍，或者一个包含数万行代码的大型软件项目。

目前公开可用的最大上下文窗口包括Google Gemini的200万Token和Anthropic Claude的20万Token。百万级上下文对于代码理解尤为关键：开发者可以将整个代码仓库一次性输入模型，让AI理解所有模块间的依赖关系和架构设计，而非像当前那样只能分片段处理。结合快速模式的设计，Capybara显然是为严肃的编程和长上下文工作负载而打造的。Anthropic在公众听到任何消息之前，已经对这个模型进行了至少8轮迭代。

Opus 4.7与Sonnet 4.8：版本线已大幅领先

代码中直接引用了Opus 4.7和Sonnet 4.8这两个目前公开不存在的版本号。这意味着Anthropic正在推进的模型谱系，已经比已发布版本领先了好几步。Anthropic的模型命名体系借鉴了音乐术语：Opus（作品）代表最强大的旗舰模型，Sonnet（十四行诗）代表性能与速度的平衡型号，Haiku（俳句）则是轻量快速的版本。版本号的大幅跃进表明，Anthropic内部的模型训练和迭代节奏远快于其公开发布的节奏。

其他内部模型代号解读

Tengu（天狗）：似乎是当前驱动Claude Code智能体任务的内部模型，与用户在claude.ai上聊天时使用的模型不同
Fennec（耳廓狐）：对应Opus 4.6，即已发布模型的内部代号
Numbat（袋食蚁兽）：最为神秘，代码中唯一的引用是一条注释——"当我们发布Numbat时删除此部分"。没有版本号、没有描述，只有一个等待被触发的发布标记

值得注意的是，Anthropic使用动物名称作为内部代号是一种常见的科技公司做法——Android曾以甜品命名版本，Apple以加州地名命名macOS。这种做法既便于内部沟通，又能在公开场合避免泄露具体产品信息。然而讽刺的是，这些精心设计的代号最终还是通过Source Map文件暴露了出来。

隐藏功能揭秘：远超AI助手的产品野心

Buddy：意想不到的AI电子宠物

这可能是整个泄露中最出人意料的发现。代码中有两个相关函数：isBuddyTeaserWindow（设定在4月1日至7日激活）和isBuddyLive（在窗口关闭后永久生效）。深入分析后发现，Buddy被描述为一个类似电子宠物（Tamagotchi）的系统——不是聊天机器人，不是生产力工具，而是一个你可以互动、照顾、随时间建立关系的AI伴侣。

Tamagotchi（拓麻歌子）是万代公司于1996年推出的电子宠物玩具，用户需要定期喂食、清洁、陪伴虚拟宠物，否则宠物会"死亡"。这一概念在AI时代被重新诠释，意味着Buddy可能具备情感状态变化、需要用户持续互动来维持"健康"的机制。这与Anthropic一贯将Claude定位为严肃专业AI助手的形象截然不同。一个具有宠物般动态关系的持久伴侣，代表着完全不同的产品方向，暗示Anthropic在消费者参与度方面的思考已远超其官网所展示的范畴。

Kairos、Dream与TMEM：构建全天候AI层

除Buddy外，代码中还埋藏着三个未公布的功能模块：

Kairos：始终在线的自主智能体模式。不是手动启动的Agent，而是在后台持续运行的存在

AI Agent（自主智能体）是当前大模型应用的核心发展方向之一，它与传统的聊天式AI交互有本质区别。传统模式下，用户发送一条指令，AI返回一个回复，交互结束。而Agent模式下，AI能够自主规划任务步骤、调用外部工具（如执行代码、读写文件、调用API）、根据中间结果动态调整策略，并在多个步骤间保持状态连续性。Kairos将这一范式推向了新的极端：从"按需启动的Agent"进化为"始终在后台运行的自主存在"，这意味着AI不再等待用户指令，而是主动监测、主动行动。

Dream：夜间记忆整合功能。当你不使用Claude时，它会在夜间处理和组织所学到的关于你和你工作的一切——类似AI的"睡眠整理"
TMEM：团队共享项目记忆。多人在同一Claude环境中工作时，共享一个了解整个项目上下文的记忆层，而非仅限于个人对话

大语言模型的一个根本限制是"无状态性"——每次对话结束后，模型不会保留任何关于用户的记忆。这意味着用户每次开启新对话都需要重新提供背景信息。为解决这一问题，各大AI公司都在探索不同的记忆架构：OpenAI的ChatGPT引入了跨对话记忆功能，Google Gemini推出了"Gems"个性化配置。Dream的"夜间记忆整合"概念借鉴了认知科学中关于睡眠与记忆巩固的研究——人类大脑在睡眠期间会对白天获取的信息进行整理、关联和强化。将这一机制应用于AI，意味着Claude会在用户离线期间主动梳理和结构化已积累的上下文知识。TMEM的团队共享记忆则解决了企业场景中的关键痛点：当多名开发者协作时，每个人与AI的对话都是孤立的，TMEM试图构建一个所有团队成员共享的项目知识库。

将这些功能串联起来看——Buddy作为持久伴侣、Kairos在后台自主运行、Dream在夜间整合记忆、TMEM构建团队共享上下文——Anthropic正在构建的东西，更接近一个与你共存的全天候AI层。他们只是还没准备好公开说出这一点。

总结：泄露背后的战略全貌

这次Anthropic源码泄露揭示的信息量巨大：Capybara已迭代至v8并拥有百万Token上下文窗口、Opus 4.7和Sonnet 4.8已在代码库中出现、卧底模式指示Claude在公开仓库中隐藏AI身份、以及Buddy/Kairos/Dream/TMEM等指向全新产品愿景的功能。

Anthropic的内部路线图显然远远领先于其公开发布计划。Source Map文件目前仍可获取，社区已完成归档，仍有人在持续挖掘。未来几天可能还会有更多发现浮出水面。

对于整个AI行业而言，这次泄露不仅揭示了具体的模型和功能，更重要的是展现了Anthropic的战略方向——从专业AI助手向全天候AI伴侣的转型。这一方向如果成真，将重新定义人与AI的交互模式。值得注意的是，这种转型并非Anthropic独有的思考。微软正在将Copilot深度嵌入Windows操作系统，Apple Intelligence试图成为设备层面的AI底座，Google则通过Gemini整合搜索、邮件、文档等全套生产力工具。AI从"工具"向"环境"的演进，正在成为行业共识。Anthropic此次泄露的代码，只是让我们提前窥见了这场变革的一个具体切面。

核心要点

Anthropic因编译时意外包含Source Map文件，导致Claude Code完整源码泄露长达3个月
代码中发现未发布模型Capybara（百万Token上下文、已迭代至v8）以及Opus 4.7和Sonnet 4.8版本号
存在"卧底模式"指令，要求Claude在公开仓库中隐藏AI身份，不留下任何AI参与痕迹
隐藏功能Buddy（AI电子宠物）、Kairos（全天候自主Agent）、Dream（夜间记忆整合）和TMEM（团队共享记忆）揭示了全新产品方向
Anthropic的内部路线图远超公开发布计划，正在从专业AI助手向全天候AI伴侣层转型