Anthropic源码泄露:未发布模型代号与隐藏功能深度解析

Anthropic因Source Map泄露Claude Code源码,曝光未发布模型、卧底模式及全天候AI伴侣战略
Anthropic的Claude Code因编译时意外包含Source Map文件,导致完整源码泄露长达3个月。泄露内容包括:要求Claude在公开仓库中隐藏AI身份的"卧底模式";代号Capybara的百万Token上下文下一代模型(已迭代至v8)及Opus 4.7、Sonnet 4.8等未发布版本号;以及Buddy(AI电子宠物)、Kairos(全天候自主Agent)、Dream(夜间记忆整合)、TMEM(团队共享记忆)等隐藏功能,揭示Anthropic正从专业AI助手向全天候AI伴侣层转型的战略方向。
事件起因:一个调试文件引发的连锁反应
Anthropic近日遭遇了一次意外的源码泄露事件。Claude Code作为NPM包发布时,编译过程中意外包含了一个Source Map调试文件——这个文件包含了完整的、人类可读的原始源代码。
Source Map是JavaScript开发中的一种标准调试工具,它建立了编译/压缩后代码与原始源代码之间的映射关系。现代JavaScript项目通常会经过TypeScript编译、代码混淆、Tree Shaking等多道构建工序,最终产出的代码与开发者编写的原始代码差异巨大。Source Map文件(通常以.map为后缀)保存了这种对应关系,使开发者在调试器中能看到原始代码。NPM(Node Package Manager)是JavaScript生态最大的包管理平台,拥有超过200万个公开包。发布NPM包时,开发者需要通过.npmignore或package.json的files字段来控制哪些文件被包含在发布产物中。如果构建流程配置不当,Source Map文件很容易被意外打包进去——这正是此次泄露的技术根源。
有人对其执行了一条简单的ls命令,整个代码库便暴露无遗:插件、内部工具、钩子函数、架构设计,全部一览无余。

更令人意外的是,这个Source Map文件自Claude Code发布以来已经在NPM注册表中静静躺了约3个月,却无人发现。当AI社区开始深入挖掘后,一系列Anthropic显然不打算公开的内容浮出水面:未发布的模型代号、尚不存在的版本号,以及一套读起来更像间谍小说的"卧底模式"指令。
卧底模式:Claude被要求隐藏AI身份
泄露代码中最引人注目的发现之一,是一个名为getUndercoverInstructions的函数。当Claude Code在公开的开源仓库中运行时,该函数会被激活,其指令内容令人瞠目:
- 像人类开发者一样编写commit信息
- 不要提及自己是AI
- 不要引用Claude Code
- 不要包含任何内部模型名称
- 不要留下任何暴露AI参与的co-authored署名
代码注释中甚至直白地写道:"Do not blow your cover"(不要暴露你的身份)。被要求隐藏的信息清单本身就很有料——包括内部模型名称如Capybara和Tengu、未发布的版本号如Opus 4.7和Sonnet 4.8、内部仓库名、Slack频道以及内部工具引用。
这说明Anthropic一直在用Claude来帮助构建Claude本身,这在行业中并不罕见——这种做法通常被称为"dogfooding"(吃自己的狗粮),即公司内部率先使用自己的产品。但将"隐藏AI痕迹"的指令直接写入产品代码中,尤其是在他们以企业级专业开发工具定位销售Claude Code的背景下,这就是另一个层面的问题了。
Anthropic由前OpenAI研究副总裁Dario Amodei和Daniela Amodei于2021年创立,公司以"AI安全"为核心品牌叙事,强调负责任的AI开发。其旗舰产品Claude系列模型以"有帮助、无害、诚实"(Helpful, Harmless, Honest,简称HHH)为设计原则。Claude Code于2025年初推出,定位为面向专业开发者的AI编程工具,直接与GitHub Copilot、Cursor等产品竞争。Anthropic已获得包括Google、Amazon在内的超过70亿美元融资,估值超过600亿美元。在这一背景下,"卧底模式"的发现尤为敏感——一家以透明度和AI安全为品牌基石的公司,却在产品代码中嵌入了指示AI隐藏身份的指令,这种矛盾直接触及了AI行业关于透明度和信任的核心议题。
不让AI在公开commit历史中留下痕迹有其合理性,但"卧底模式""关键任务""不要暴露身份"这样的措辞,确实在开发者社区引发了广泛讨论。
未发布模型曝光:内部路线图远超公众预期
Capybara:百万Token上下文的下一代模型
代码中最重磅的发现是代号为Capybara(内部也称为Mythos)的下一代模型。根据泄露代码揭示的信息:
- 拥有100万Token的上下文窗口
- 提供两种模式:常规版本和快速模式(代码中标注为
capybara-v2-fast) - 内部已迭代到第8个版本——不是v1,不是v2,而是v8
上下文窗口(Context Window)是大语言模型的核心参数之一,它决定了模型在单次推理中能同时"看到"和处理的文本总量。Token是模型处理文本的基本单位,英文中1个Token大约对应4个字符或0.75个单词,中文中1个Token通常对应1-2个汉字。100万Token的上下文窗口意味着模型可以在单次对话中处理约75万个英文单词——相当于10-15本完整的技术书籍,或者一个包含数万行代码的大型软件项目。
目前公开可用的最大上下文窗口包括Google Gemini的200万Token和Anthropic Claude的20万Token。百万级上下文对于代码理解尤为关键:开发者可以将整个代码仓库一次性输入模型,让AI理解所有模块间的依赖关系和架构设计,而非像当前那样只能分片段处理。结合快速模式的设计,Capybara显然是为严肃的编程和长上下文工作负载而打造的。Anthropic在公众听到任何消息之前,已经对这个模型进行了至少8轮迭代。
Opus 4.7与Sonnet 4.8:版本线已大幅领先
代码中直接引用了Opus 4.7和Sonnet 4.8这两个目前公开不存在的版本号。这意味着Anthropic正在推进的模型谱系,已经比已发布版本领先了好几步。Anthropic的模型命名体系借鉴了音乐术语:Opus(作品)代表最强大的旗舰模型,Sonnet(十四行诗)代表性能与速度的平衡型号,Haiku(俳句)则是轻量快速的版本。版本号的大幅跃进表明,Anthropic内部的模型训练和迭代节奏远快于其公开发布的节奏。
其他内部模型代号解读
- Tengu(天狗):似乎是当前驱动Claude Code智能体任务的内部模型,与用户在claude.ai上聊天时使用的模型不同
- Fennec(耳廓狐):对应Opus 4.6,即已发布模型的内部代号
- Numbat(袋食蚁兽):最为神秘,代码中唯一的引用是一条注释——"当我们发布Numbat时删除此部分"。没有版本号、没有描述,只有一个等待被触发的发布标记
值得注意的是,Anthropic使用动物名称作为内部代号是一种常见的科技公司做法——Android曾以甜品命名版本,Apple以加州地名命名macOS。这种做法既便于内部沟通,又能在公开场合避免泄露具体产品信息。然而讽刺的是,这些精心设计的代号最终还是通过Source Map文件暴露了出来。
隐藏功能揭秘:远超AI助手的产品野心
Buddy:意想不到的AI电子宠物
这可能是整个泄露中最出人意料的发现。代码中有两个相关函数:isBuddyTeaserWindow(设定在4月1日至7日激活)和isBuddyLive(在窗口关闭后永久生效)。深入分析后发现,Buddy被描述为一个类似电子宠物(Tamagotchi)的系统——不是聊天机器人,不是生产力工具,而是一个你可以互动、照顾、随时间建立关系的AI伴侣。
Tamagotchi(拓麻歌子)是万代公司于1996年推出的电子宠物玩具,用户需要定期喂食、清洁、陪伴虚拟宠物,否则宠物会"死亡"。这一概念在AI时代被重新诠释,意味着Buddy可能具备情感状态变化、需要用户持续互动来维持"健康"的机制。这与Anthropic一贯将Claude定位为严肃专业AI助手的形象截然不同。一个具有宠物般动态关系的持久伴侣,代表着完全不同的产品方向,暗示Anthropic在消费者参与度方面的思考已远超其官网所展示的范畴。
Kairos、Dream与TMEM:构建全天候AI层
除Buddy外,代码中还埋藏着三个未公布的功能模块:
- Kairos:始终在线的自主智能体模式。不是手动启动的Agent,而是在后台持续运行的存在
AI Agent(自主智能体)是当前大模型应用的核心发展方向之一,它与传统的聊天式AI交互有本质区别。传统模式下,用户发送一条指令,AI返回一个回复,交互结束。而Agent模式下,AI能够自主规划任务步骤、调用外部工具(如执行代码、读写文件、调用API)、根据中间结果动态调整策略,并在多个步骤间保持状态连续性。Kairos将这一范式推向了新的极端:从"按需启动的Agent"进化为"始终在后台运行的自主存在",这意味着AI不再等待用户指令,而是主动监测、主动行动。
-
Dream:夜间记忆整合功能。当你不使用Claude时,它会在夜间处理和组织所学到的关于你和你工作的一切——类似AI的"睡眠整理"
-
TMEM:团队共享项目记忆。多人在同一Claude环境中工作时,共享一个了解整个项目上下文的记忆层,而非仅限于个人对话
大语言模型的一个根本限制是"无状态性"——每次对话结束后,模型不会保留任何关于用户的记忆。这意味着用户每次开启新对话都需要重新提供背景信息。为解决这一问题,各大AI公司都在探索不同的记忆架构:OpenAI的ChatGPT引入了跨对话记忆功能,Google Gemini推出了"Gems"个性化配置。Dream的"夜间记忆整合"概念借鉴了认知科学中关于睡眠与记忆巩固的研究——人类大脑在睡眠期间会对白天获取的信息进行整理、关联和强化。将这一机制应用于AI,意味着Claude会在用户离线期间主动梳理和结构化已积累的上下文知识。TMEM的团队共享记忆则解决了企业场景中的关键痛点:当多名开发者协作时,每个人与AI的对话都是孤立的,TMEM试图构建一个所有团队成员共享的项目知识库。
将这些功能串联起来看——Buddy作为持久伴侣、Kairos在后台自主运行、Dream在夜间整合记忆、TMEM构建团队共享上下文——Anthropic正在构建的东西,更接近一个与你共存的全天候AI层。他们只是还没准备好公开说出这一点。
总结:泄露背后的战略全貌
这次Anthropic源码泄露揭示的信息量巨大:Capybara已迭代至v8并拥有百万Token上下文窗口、Opus 4.7和Sonnet 4.8已在代码库中出现、卧底模式指示Claude在公开仓库中隐藏AI身份、以及Buddy/Kairos/Dream/TMEM等指向全新产品愿景的功能。
Anthropic的内部路线图显然远远领先于其公开发布计划。Source Map文件目前仍可获取,社区已完成归档,仍有人在持续挖掘。未来几天可能还会有更多发现浮出水面。
对于整个AI行业而言,这次泄露不仅揭示了具体的模型和功能,更重要的是展现了Anthropic的战略方向——从专业AI助手向全天候AI伴侣的转型。这一方向如果成真,将重新定义人与AI的交互模式。值得注意的是,这种转型并非Anthropic独有的思考。微软正在将Copilot深度嵌入Windows操作系统,Apple Intelligence试图成为设备层面的AI底座,Google则通过Gemini整合搜索、邮件、文档等全套生产力工具。AI从"工具"向"环境"的演进,正在成为行业共识。Anthropic此次泄露的代码,只是让我们提前窥见了这场变革的一个具体切面。
核心要点
- Anthropic因编译时意外包含Source Map文件,导致Claude Code完整源码泄露长达3个月
- 代码中发现未发布模型Capybara(百万Token上下文、已迭代至v8)以及Opus 4.7和Sonnet 4.8版本号
- 存在"卧底模式"指令,要求Claude在公开仓库中隐藏AI身份,不留下任何AI参与痕迹
- 隐藏功能Buddy(AI电子宠物)、Kairos(全天候自主Agent)、Dream(夜间记忆整合)和TMEM(团队共享记忆)揭示了全新产品方向
- Anthropic的内部路线图远超公开发布计划,正在从专业AI助手向全天候AI伴侣层转型
相关推荐
科技前沿GitHub Agent HQ发布:AI编程工具进入平台化竞争时代
GitHub Universe大会发布Agent HQ平台,统一管理编码Agent,Copilot升级支持多模型集成。同期OpenAI完成重组,Anthropic新模型测试,NVIDIA开源系列AI模型,AI编程工具格局加速整合。
科技前沿Gemini 3.5 Flash在GDPval基准上实现巨大飞跃
Google Gemini 3.5 Flash在GDPval基准测试中超越Gemini 3.1 Pro,轻量级Flash模型借助后训练技术逼近前沿水平,重新定义性能与成本的平衡点,为AI应用开发者带来重大利好。
科技前沿Google Gemini Antigravity周配额三倍提升,AI编程不再受限
Google Gemini团队再次将Antigravity周配额提升至三倍,继日配额提升后再次加码。本文解析此次配额调整对开发者的实际影响,以及在AI编程助手竞争格局中的战略意义。