Replit CEO访谈:AI Agent能力边界、长程推理突破与AGI困局

Replit CEO谈AI Agent技术边界、自然语言编程突破与AGI局部最优陷阱
Replit CEO Amjad Masad在深度访谈中揭示了AI编程工具的真实能力边界。他回顾了从机器码到自然语言编程的演进历程,指出Grace Hopper 75年前"用英语编程"的愿景已成现实。Replit发现AI Agent已成为平台真正用户,迫使基础设施设计逻辑重构。Agent长程推理能力从2分钟跃升至200分钟,背后依靠强化学习和验证循环两大技术突破,但也引发对AGI是否陷入局部最优的行业焦虑。
Replit CEO深度访谈:AI Agent的真实边界与AGI的局部最优陷阱
Replit CEO Amjad Masad 近日在一次深度播客访谈中,围绕AI Agent的技术演进、编程的未来形态、AGI的可行性以及自己从约旦黑客少年到硅谷创业者的传奇经历,展开了一场极为坦诚的对话。这场对话不仅揭示了当前AI编程工具的真实能力边界,也触及了整个AI行业最核心的焦虑——我们是否正陷入一个"够用"的局部最优陷阱?
英语就是编程语言:从Grace Hopper到自然语言编程
Amjad回顾了编程语言的抽象化历程:从机器码到汇编,从C到Python,每一次抽象层级的提升都伴随着老一代程序员对新一代的鄙视。他自己就经历过这种循环——在Facebook参与构建React和现代JavaScript工具链时,遭到"原教旨主义"程序员的攻击;而如今,那些在React上建立职业生涯的人,又在抵制AI编程这一新范式。
他引用了编译器发明者Grace Hopper 75年前的愿景:"我想让人们用英语编程。"这位美国海军少将、计算机科学先驱(1906-1992)被誉为"编程祖母"——她在1952年开发了世界上第一个编译器A-0,将人类可读的数学符号转换为机器代码,彻底颠覆了"计算机只能执行机器码"的认知。她后来主导开发的COBOL语言(1959年)使用接近英语的语法描述业务逻辑,在当时被许多工程师嘲笑为"不切实际",但她的坚持奠定了高级编程语言的理论基础。70年后,大语言模型终于让"用英语编程"从隐喻变为现实,这一历史闭环具有深刻的象征意义。
如今这个愿景终于实现了。在Replit上,用户只需输入"I want to sell crepes online"这样的自然语言描述,Agent就会自动选择最佳技术栈、搭建数据库、集成支付系统、编写代码、甚至自动测试——整个过程可能只需20到30分钟。
更值得关注的是,这不仅支持英语,日语等主流语言同样适用。代码不再是瓶颈,语法不再是障碍。Amjad坦言,Replit过去十年构建了出色的平台,但业务表现不佳的根本原因就是"代码本身仍然是瓶颈"。自然语言编程的到来,彻底改变了这个局面。
Agent的真实用户不是人类:一个意外的架构发现
当Replit推出Agent功能后,团队发现了一个出乎意料的事实:系统的真正用户不再是人类,而是AI Agent本身。

一个典型的例子是:Replit在亚洲部署了服务器以降低印度和日本用户的延迟,但Agent上线后,这些用户的体验反而变差了。原因很简单——AI模型运行在美国,Agent作为"程序员"需要从美国向亚洲的机器发送指令,跨洋通信反而增加了延迟。
这个发现深刻揭示了一个范式转变:Agent就是程序员,它拥有写文件、编辑文件、搜索包索引、配置数据库等工具接口,其工作方式与人类程序员高度相似。当AI Agent成为平台的主要使用者,整个基础设施的设计逻辑都需要重新思考——服务器的地理布局、网络拓扑的优化策略,乃至API的设计哲学,都必须以"AI作为主要调用方"为前提重新审视。
长程推理的突破:从2分钟到200分钟
访谈中最具技术深度的部分是关于AI Agent"长程推理"(Long Horizon Reasoning)能力的讨论。早期的AI Agent在运行两三分钟后就会"精神错乱"——错误不断累积,推理越来越混乱,甚至会突然开始输出中文或做出完全不相关的行为。
Amjad分享了Replit Agent三代产品的关键性能数据:
- Agent 1:稳定运行约2分钟
- Agent 2(2025年2月):稳定运行约20分钟
- Agent 3:稳定运行约200分钟,部分用户甚至推到12小时
这种指数级增长背后有两个关键技术突破:
第一是强化学习(RL)的深度应用。 传统预训练只是让模型猜测下一个词,这并不能带来真正的长程推理能力。强化学习(Reinforcement Learning)是机器学习的三大范式之一,其核心思想是让智能体通过与环境交互、获取奖励信号来学习最优策略。AlphaGo(2016年)是RL与深度神经网络结合的里程碑:它使用蒙特卡洛树搜索(MCTS)展开多条推理轨迹,结合神经网络评估局面价值,最终击败人类围棋冠军。这一范式的关键在于"生成+验证"的分离——神经网络负责生成候选动作,搜索算法负责验证哪条路径更优。将这一思路迁移到代码生成领域,意味着AI不再只是"预测下一个token",而是能够展开多条编程思路、通过代码执行结果来验证并强化正确路径。特别是基于代码执行的RL,让模型能够展开多条"轨迹"(trajectories),通过尝试不同的推理路径并对成功路径进行奖励,从而学会解决复杂问题。
第二是验证循环(Verification Loop)机制。 这是Replit在应用层的核心创新,同时也巧妙地解决了大语言模型"上下文中间遗忘
相关推荐
观点碰撞Windsurf CEO深度访谈:速度是唯一的护城河
Windsurf CEO Varun Mohan深度访谈,分享AI编程IDE的创业pivot经验、产品构建方法论、异步Agent挑战,以及与Cursor竞争的差异化策略。速度才是创业公司唯一的护城河。
观点碰撞被低估即自由:AI时代的逆向竞争哲学
探讨AI行业中"被低估即自由"的逆向竞争策略。从OpenAI、DeepSeek到Cursor,解析为何低调积蓄力量比站在风口浪尖更具战略优势,以及这一哲学对AI创业者和从业者的深刻启示。
观点碰撞新教工作伦理如何被劫持:从保护工人到压迫工人的演变
哲学家Elizabeth Anderson揭示新教工作伦理如何从保护工人的理想被扭曲为压迫工具。从清教徒的公平商业伦理到新自由主义的复活,深度解析工作伦理的历史演变及其对AI时代劳动关系的启示。