卡帕西加入Anthropic:从Vibe Coding到智能体工程的行业变局

AI大神卡帕西加入Anthropic,回归前沿研发一线
前OpenAI创始成员、特斯拉AI总监安德烈·卡帕西正式加入Anthropic。他在过去半年经历了对AI能力的认知逆转,从批评AI智能体不足到被编程智能体的进展震撼。他的思想也从提出"Vibe Coding"概念演进到"Agentic Engineering",认为工程师角色将从代码编写者转变为智能体编排者,并暂时搁置教育事业全力投入前沿研发。
重磅消息:AI精神领袖的战略转向
安德烈·卡帕西(Andrej Karpathy),这位被无数AI从业者视为精神领袖的大神级人物,正式宣布加入Anthropic。作为OpenAI的创始成员、特斯拉自动驾驶纯视觉路线的奠基人、全球最有影响力的AI教育者,他的每一次职业变动几乎都精准踩中了技术演进的关键节点。
卡帕西于2015年在斯坦福大学李飞飞门下完成计算机视觉方向的博士学位,其博士论文聚焦于将卷积神经网络应用于图像描述生成。他随后加入OpenAI成为创始成员,2017年转赴特斯拉担任AI总监,主导了完全摒弃激光雷达、仅依赖摄像头的纯视觉自动驾驶方案——这一决策在业界引发巨大争议,但也奠定了特斯拉FSD系统的技术路线。2023年他离开特斯拉后创办AI教育公司Eureka Labs,并在YouTube上发布的神经网络系列教程累计播放量超过千万,被誉为"AI领域最好的免费教育资源"之一。
卡帕西的官宣极为简短,只传达了三个核心信息:已加入Anthropic;认为未来几年大语言模型前沿发展将尤其具有塑造意义,非常兴奋能回到研发一线;依然对教育充满热情,计划在时机成熟时恢复相关工作。你可能没注意到,他并未关闭自己创办的AI教育公司Eureka Labs,只是阶段性搁置教育事业,全职投入前沿研发。
认知逆转:从批评到被震撼
要理解卡帕西这次选择Anthropic的深层逻辑,需要了解他在过去半年里对AI能力跃升的认知发生了根本性逆转。2025年末,他还曾公开批评AI智能体智力不足、多模态能力欠缺、缺乏持续学习能力。但仅仅几个月后,他就坦承自己被用于编程的智能体AI的最新进展彻底震撼。
当底层大模型已经进化到可以自主规划项目架构、自主诊断复杂环境依赖并修复错误时,要求学生花费大量时间手动编写底层反向传播代码,多少有点已经偏离了技术演进的最前沿。反向传播(Backpropagation)是神经网络训练的核心算法,通过链式法则将输出误差逐层向前传递,计算每个参数对损失函数的梯度,从而指导权重更新。手动实现反向传播长期被视为深度学习入门的"成人礼"——只有真正从零推导过梯度计算,才能深刻理解神经网络的工作原理。卡帕西的LLM101N项目正是沿袭这一传统,试图带领学习者从最基础的神经元开始,一步步构建出完整的语言模型。然而当前沿模型已能自主完成这些底层实现时,这种教育路径的必要性确实面临重新审视——不是因为基础不重要,而是教育的起点和终点都需要随技术边界的移动而重新校准。GitHub上LLM101N代码库目前处于归档状态,正暗示着旧的教育范式需要等待新的前沿技术稳定后才能重构。
从Vibe Coding到Agentic Engineering的思想蜕变
2025年2月,卡帕西首次创造了"Vibe Coding"(直觉编程)这一术语,描述一种由大语言模型赋能的全新开发体验——开发者只需通过自然语言表达需求,AI工具就能自动生成代码、搭建网站并完成部署。

Vibe Coding本质上是对"提示工程驱动开发"(Prompt-Driven Development)的通俗化描述。开发者通过自然语言向Cursor、GitHub Copilot等AI编程工具描述需求,模型基于上下文窗口内的代码理解生成对应实现。这种范式在小型项目或原型验证阶段效率极高,但存在两个结构性缺陷:其一是"技能空洞化"——开发者逐渐失去调试能力,当AI生成的代码出错时无法有效干预;其二是"上下文窗口瓶颈"——即便GPT-4级别的模型拥有128K token的上下文,面对数十万行的企业级代码库仍然力不从心,模型会在缺乏全局理解的情况下产生局部一致但系统级矛盾的幻觉代码,形成难以追踪的级联错误。
然而随着实践深入,卡帕西敏锐地察觉到这两个致命问题。他的研究智能体曾在两天内自动运行700次实验,期间为匹配不同数据库的用户ID,居然试图通过对比字符串格式的电子邮件地址进行暴力匹配——这深刻暴露了早期Vibe Coding的脆弱性。
于是卡帕西正式提出了"Agentic Engineering"(智能体工程)的概念。他的"软件演进三阶段论"提供了理解这一转变的重要框架:软件1.0对应传统命令式编程,逻辑完全由人类显式编码;软件2.0对应深度学习时代,人类设计网络架构和损失函数,行为由数据和梯度下降隐式涌现;软件3.0则是以大语言模型为基础设施的智能体编程范式。在这一范式下,工程师的核心工作转变为:设计任务分解策略、定义验证标准、构建工具调用接口(Tool Use/Function Calling)、以及设计多智能体协作的编排逻辑(Orchestration)。这要求工程师具备更强的系统思维和抽象能力,而非更快的代码输入速度。工程师的职责必须从"编写者"跃升为"编排者
相关推荐
行业洞察AI产品开发实战:模型选择、护城河构建与商业化路径
分享AI产品开发的实战策略,包括为什么不应从头训练模型、如何选择API调用与微调时机、构建产品护城河的关键要素,以及从评测体系搭建到商业化落地的完整执行路径。
行业洞察没有想要的产品?自己做才是独立开发者的最佳起点
市面上找不到满意的产品怎么办?从个人痛点出发,自己动手开发,正是独立开发者最好的切入方式。本文分析为什么小众需求反而是理想的创业起点,以及AI工具如何让一个人也能快速把想法变成产品。
行业洞察OpenAI Codex教程遭批量搬运,AI内容农场现象引关注
B站上至少9个账号批量发布相同的OpenAI Codex教程视频,暴露AI工具教程领域的内容农场问题。本文分析批量搬运的典型特征,探讨平台治理挑战,并提供辨别原创内容的实用建议。