谷歌CEO皮查伊坦承AI编程落后,详解追赶策略与AGI展望
谷歌CEO皮查伊坦承AI编程落后,详解追赶策略与AGI展望
在最新一期Hard Fork播客中,谷歌CEO桑达尔·皮查伊(Sundar Pichai)罕见地公开承认谷歌在AI编程领域暂时落后于竞争对手,同时分享了他对AGI、AI搜索变革以及公众焦虑的深度思考。这场坦诚的对话,为我们揭开了这家科技巨头在AI竞赛中的真实处境。
坦承落后:AI编程是谷歌当前最大短板
皮查伊在采访中直言不讳地承认,谷歌在AI领域并非全面领先。他将谷歌的AI能力做了一个清晰的划分:在文本生成、多模态、语音/音频处理、推理能力和整体智能方面,谷歌表现非常出色;但在智能体编程(agentic coding)、工具使用、指令跟随以及长周期任务方面,谷歌"目前确实有些落后"。
智能体编程是2024-2025年AI编程领域最重要的范式转变。与传统的代码补全或单次生成不同,agentic coding指的是AI系统能够像一个自主的软件工程师一样工作——理解需求、制定计划、编写代码、运行测试、发现错误并自主修复,整个过程可能持续数十分钟甚至数小时。这种模式要求模型具备长期规划能力、工具调用能力(如操作终端、读写文件、运行调试器)以及在复杂代码库中导航的能力。Cursor、Devin、Claude Code等产品正是这一方向的代表。
他特别提到,编程之所以落后,一个关键原因是数据流的获取。Anthropic通过与Cursor的合作获得了大量真实编程场景的数据反馈,而谷歌在这方面缺乏类似的成熟数据入口。"获取数据流在编程领域至关重要,而我们可能在这方面的触达面还不够。"皮查伊坦言。
这里涉及的是AI领域经典的数据飞轮效应。当Anthropic的Claude模型通过Cursor被数百万开发者日常使用时,每一次用户的接受、拒绝、修改操作都构成了宝贵的人类反馈信号。这些信号经过处理后可用于RLHF(基于人类反馈的强化学习)训练,使模型在真实编程场景中持续改进。改进后的模型吸引更多用户,产生更多数据,形成正向循环。这就是为什么在AI产品竞争中,"分发渠道"和"用户触达"往往比纯粹的模型能力更具战略价值——谁先占据开发者的日常工作流,谁就能获得最优质的训练信号。
不过他也强调,编程是"极其基础性的能力",谷歌正在全力追赶。在单次生成网页前端等场景中,谷歌的模型已经非常出色,差距主要体现在复杂代码库上的长时间开发任务。
Gemini 2.5 Flash发布争议:皮查伊如何回应
采访时,Gemini 2.5 Flash刚发布一天,市场反馈褒贬不一——用户对定价和模型质量提出了不少批评。皮查伊对此回应得相当坦诚:"新模型在新领域取得了进步,但可能存在一些回退(regressions),我们能通过后训练快速解决。"
模型回退是大语言模型开发中一个普遍且棘手的问题。当研究团队针对某些能力(如数学推理或编程)进行优化训练时,模型在其他维度(如创意写作、指令跟随或特定语言的表现)可能出现性能下降。这类似于神经科学中的"灾难性遗忘"现象——神经网络在学习新任务时覆盖了旧任务的权重。业界通常通过多目标优化、混合训练数据配比、以及大规模评估基准来检测和缓解回退。皮查伊提到的"后训练快速解决"指的是通过针对性的微调或RLHF来修补特定能力的退化,而无需重新进行成本高昂的预训练。
他还透露,由于发布当天推出了大量新功能,谷歌收紧了使用限制以避免宕机,这引发了用户的不满。"这种挫败感完全可以理解,我自己也有同感。"他承诺将很快放宽限制。
一个值得关注的数据是:谷歌内部对AI模型的使用量正以每周翻倍的速度增长。皮查伊称他在Google I/O上分享了这个数据,"在内部我从未见过这样的增长势头。"这种内部大规模使用正在帮助模型快速迭代提升——谷歌拥有超过18万名员工,其中大量是工程师和研究人员,他们的日常使用本身就构成了一个庞大的内部测试和反馈系统。
AI搜索革命:谷歌25年来最大变革
谷歌搜索正在经历创立以来最大的变革。皮查伊透露,AI模式的整合正在深入推进,但他选择了一种渐进而非激进的路径。
"一年前我们还没有AI模式,但现在很多人已经在体验它了。"他强调不会贸然取消传统的"十个蓝色链接",因为"需要带着用户一起走这段旅程,确保产品符合他们的期望。"
当主持人提到自己过去一年几乎没有做过传统搜索时,皮查伊没有表现出担忧,而是指出AI模式下搜索能为用户创造更多价值。他对商业模式的前景保持乐观:"经济价值始终是你给用户创造的总价值的函数。通过订阅和广告的组合,正确的模式会持续存在。亚当·斯密的法则在新世界里不会改变。"
这种乐观背后是谷歌面临的真实商业挑战。传统搜索的商业逻辑是:用户输入查询→搜索引擎展示结果页面→用户点击链接→广告主为点击付费。但在AI模式下,如果AI直接给出答案,用户不再需要点击外部链接,这就从根本上威胁了每年超过2000亿美元的搜索广告市场。谷歌需要在用户体验升级和广告收入保护之间找到平衡。目前的探索方向包括:在AI回答中嵌入赞助内容、对高级AI功能收取订阅费(如Gemini Advanced的月费模式)、以及通过AI购物助手等新场景创造交易型收入。皮查伊引用亚当·斯密,本质上是在表达一个信念:只要能为用户创造足够大的价值,变现方式总会找到。
面对公众AI焦虑:理解但不悲观
一项最新调查显示,仅16%的人认为AI"基本是好的",而35%的人认为"基本是坏的"。面对这个数据,皮查伊表现出了少见的深思。
"AI一直被视为人类将研究的最深刻技术,它正以非凡的速度发展。人类的进化并没有让我们适应如此快速的变化。"他认为公众的焦虑是自然且合理的,尤其是对经济前景的担忧——"如果你不断听到工作将被颠覆、某些岗位将消失,你自然会焦虑。如果人们不焦虑,我反而会感到惊讶。"
但他也对未来持积极态度。他用电子表格的类比来说明技术变革的正面效应:"电子表格出现之前人们是怎么做财务分析的?AI将改变许多人的起点。"他还以医疗行业为例——医生因行政事务导致与患者相处时间减少、职业倦怠率高,AI恰恰能帮助他们回归本职。
放射科医生的例子尤其值得思考:"十年来人们一直在预测放射科医生会被取代。但现实是,每次扫描的数据量是十年前的10倍,未来还将再增10倍——你实际上需要AI才能跟上这种需求增长。"这个例子揭示了技术替代论的一个常见盲区:技术进步往往不是简单地替代现有工作量,而是同时创造了远超人类处理能力的新需求。当MRI和CT扫描的分辨率不断提高、扫描频次不断增加时,需要分析的医学影像数据呈指数级增长,AI在这里扮演的角色更像是"能力放大器"而非"人力替代者"。
AGI展望:皮查伊从模糊走向清晰
2023年上次采访时,皮查伊对AGI这个术语态度暧昧。这次,他的立场明显前移。
"过去一两年的进展速度让我觉得AGI更接近了,而不是更远。"他说。但作为全球最大公司之一的掌舵人,他在措辞上依然谨慎:"在我的角色中,围绕它使用的语言可能与其他人不同。"
关于DeepMind负责人Demis Hassabis在I/O上说的"我们在奇点的山脚下"这句话,皮查伊解释道:Demis所定义的奇点就是AGI的到来。"如果这是你的信念,那么把它说出来很重要,因为我们都在前沿构建这项技术。希望人们在倾听,作为一个社会,我们需要内化这个认知并做好准备。"
值得注意的是,AGI(通用人工智能)至今没有统一的行业定义。OpenAI将其定义为"在大多数经济上有价值的工作中超越人类的AI系统";DeepMind则倾向于用能力层级来衡量,从"新手级"到"超人级"划分了五个等级。谷歌内部对AGI的讨论态度从回避到正视,本身就反映了整个行业对这一里程碑临近程度的判断正在发生根本性转变。
递归自我改进:谷歌的理性安全态度
当被问及递归自我改进(RSI)这一敏感话题时,皮查伊展现了务实的一面。他指出,谷歌的AI系统在12小时内可以从零构建一个简单的操作系统,这在人工场景下需要数千小时。但他明确表示:"我不认为我们已经达到了人们所描述的那种递归自我改进的程度。"
递归自我改进是AI安全领域最核心的担忧之一,也是通往超级智能的理论路径。其基本逻辑是:如果一个AI系统足够智能,能够理解并改进自身的代码和训练过程,那么改进后的版本将更有能力进行下一轮自我改进,形成指数级加速的智能爆炸。这个概念最早由数学家I.J. Good在1965年提出,被称为"智能爆炸"假说。目前的现实是,AI确实已经在辅助AI研究(如自动化超参数搜索、生成训练数据、发现算法改进),但尚未达到完全自主的闭环改进。皮查伊提到的"12小时构建操作系统"展示了AI惊人的工程执行能力,但距离真正的RSI——即AI自主设计更好的AI架构并训练出更强的自己——仍有本质差距。
更重要的是他对安全边界的表态:"如果接近那样的时刻,不应该只是一场内部对话,而必须是更广泛的社会对话。在AGI的这些阶段,我们都必须避免竞赛条件(race conditions)。"
皮查伊使用"race conditions"一词颇具深意。在计算机科学中,竞赛条件指多个进程同时访问共享资源时因时序不确定而导致的错误——这是一个关于"失控"的隐喻。在AI安全语境下,它指的是多家公司为了抢先达到AGI而忽视安全测试和对齐工作的危险局面。如果每家公司都认为"如果我不先做到,竞争对手也会做到",就可能集体跳过必要的安全验证步骤。这正是为什么皮查伊强调需要"更广泛的社会对话"——他暗示在接近AGI的关键节点,行业需要某种形式的协调机制,而非纯粹的市场竞争逻辑驱动一切。
写在最后
这次采访中最令人印象深刻的,或许是皮查伊那种少见的坦诚。他没有回避谷歌在AI编程领域的差距,没有用公关辞令粉饰Gemini 2.5 Flash的争议,也没有对公众的AI焦虑表现出不屑。
当一个管理着数万亿美元市值公司的CEO说出"在这个领域,30到60天看起来就像五年"的时候,你能感受到AI竞赛的白热化程度。但正如他所说的——谷歌是唯一一家真正站在AI前沿的大型公司,这本身就说明了某些问题。
差距是暂时的,但认知差距才是致命的。至少从这次对话来看,谷歌清楚地知道自己在哪里,要去哪里。
相关推荐

Cosmos统一智能体平台首次实机演示:多Agent协作的平台化解决方案
Cosmos统一智能体平台首次公开实机演示,详解其设计理念与云端智能体运行实践。了解这一平台如何解决AI Agent碎片化问题,实现多智能体统一构建、部署与管理。
Agent智能体入门教程:原理架构与实战效率提升指南
Agent智能体入门教程:原理架构与实战效率提升指南
深入讲解AI智能体(Agent)的底层原理、核心架构与实战应用。从大模型与智能体的本质区别出发,解析Agent的感知、规划、执行能力,帮助开发者和测试工程师快速掌握Agent Skill,全面提升工作效率。
谷歌CEO承认Gemini编程落后:缺入口只是表象,真正问题是什么
谷歌CEO承认Gemini编程落后:缺入口只是表象,真正问题是什么
谷歌CEO皮查伊坦承Gemini在AI编程领域落后于Cursor和Claude Code,将原因归结为缺少产品入口。但深入分析发现,真正问题在于产品体验失败、开发者信任流失和生态优势未能转化为竞争力。