Replit CEO访谈：AI Agent能力边界、长程推理突破与AGI困局

Replit CEO深度访谈：AI Agent的真实边界与AGI的局部最优陷阱

Replit CEO Amjad Masad 近日在一次深度播客访谈中，围绕AI Agent的技术演进、编程的未来形态、AGI的可行性以及自己从约旦黑客少年到硅谷创业者的传奇经历，展开了一场极为坦诚的对话。这场对话不仅揭示了当前AI编程工具的真实能力边界，也触及了整个AI行业最核心的焦虑——我们是否正陷入一个"够用"的局部最优陷阱？

英语就是编程语言：从Grace Hopper到自然语言编程

Amjad回顾了编程语言的抽象化历程：从机器码到汇编，从C到Python，每一次抽象层级的提升都伴随着老一代程序员对新一代的鄙视。他自己就经历过这种循环——在Facebook参与构建React和现代JavaScript工具链时，遭到"原教旨主义"程序员的攻击；而如今，那些在React上建立职业生涯的人，又在抵制AI编程这一新范式。

他引用了编译器发明者Grace Hopper 75年前的愿景："我想让人们用英语编程。"这位美国海军少将、计算机科学先驱（1906-1992）被誉为"编程祖母"——她在1952年开发了世界上第一个编译器A-0，将人类可读的数学符号转换为机器代码，彻底颠覆了"计算机只能执行机器码"的认知。她后来主导开发的COBOL语言（1959年）使用接近英语的语法描述业务逻辑，在当时被许多工程师嘲笑为"不切实际"，但她的坚持奠定了高级编程语言的理论基础。70年后，大语言模型终于让"用英语编程"从隐喻变为现实，这一历史闭环具有深刻的象征意义。

如今这个愿景终于实现了。在Replit上，用户只需输入"I want to sell crepes online"这样的自然语言描述，Agent就会自动选择最佳技术栈、搭建数据库、集成支付系统、编写代码、甚至自动测试——整个过程可能只需20到30分钟。

更值得关注的是，这不仅支持英语，日语等主流语言同样适用。代码不再是瓶颈，语法不再是障碍。Amjad坦言，Replit过去十年构建了出色的平台，但业务表现不佳的根本原因就是"代码本身仍然是瓶颈"。自然语言编程的到来，彻底改变了这个局面。

Agent的真实用户不是人类：一个意外的架构发现

当Replit推出Agent功能后，团队发现了一个出乎意料的事实：系统的真正用户不再是人类，而是AI Agent本身。

Agent架构示意

一个典型的例子是：Replit在亚洲部署了服务器以降低印度和日本用户的延迟，但Agent上线后，这些用户的体验反而变差了。原因很简单——AI模型运行在美国，Agent作为"程序员"需要从美国向亚洲的机器发送指令，跨洋通信反而增加了延迟。

这个发现深刻揭示了一个范式转变：Agent就是程序员，它拥有写文件、编辑文件、搜索包索引、配置数据库等工具接口，其工作方式与人类程序员高度相似。当AI Agent成为平台的主要使用者，整个基础设施的设计逻辑都需要重新思考——服务器的地理布局、网络拓扑的优化策略，乃至API的设计哲学，都必须以"AI作为主要调用方"为前提重新审视。

长程推理的突破：从2分钟到200分钟

访谈中最具技术深度的部分是关于AI Agent"长程推理"（Long Horizon Reasoning）能力的讨论。早期的AI Agent在运行两三分钟后就会"精神错乱"——错误不断累积，推理越来越混乱，甚至会突然开始输出中文或做出完全不相关的行为。

Amjad分享了Replit Agent三代产品的关键性能数据：

Agent 1：稳定运行约2分钟
Agent 2（2025年2月）：稳定运行约20分钟
Agent 3：稳定运行约200分钟，部分用户甚至推到12小时

这种指数级增长背后有两个关键技术突破：

第一是强化学习（RL）的深度应用。 传统预训练只是让模型猜测下一个词，这并不能带来真正的长程推理能力。强化学习（Reinforcement Learning）是机器学习的三大范式之一，其核心思想是让智能体通过与环境交互、获取奖励信号来学习最优策略。AlphaGo（2016年）是RL与深度神经网络结合的里程碑：它使用蒙特卡洛树搜索（MCTS）展开多条推理轨迹，结合神经网络评估局面价值，最终击败人类围棋冠军。这一范式的关键在于"生成+验证"的分离——神经网络负责生成候选动作，搜索算法负责验证哪条路径更优。将这一思路迁移到代码生成领域，意味着AI不再只是"预测下一个token"，而是能够展开多条编程思路、通过代码执行结果来验证并强化正确路径。特别是基于代码执行的RL，让模型能够展开多条"轨迹"（trajectories），通过尝试不同的推理路径并对成功路径进行奖励，从而学会解决复杂问题。

第二是验证循环（Verification Loop）机制。 这是Replit在应用层的核心创新，同时也巧妙地解决了大语言模型"上下文中间遗忘

Replit CEO访谈：AI Agent能力边界、长程推理突破与AGI困局

Replit CEO深度访谈：AI Agent的真实边界与AGI的局部最优陷阱

英语就是编程语言：从Grace Hopper到自然语言编程

Agent的真实用户不是人类：一个意外的架构发现

长程推理的突破：从2分钟到200分钟

相关推荐

Windsurf CEO深度访谈：速度是唯一的护城河

被低估即自由：AI时代的逆向竞争哲学

新教工作伦理如何被劫持：从保护工人到压迫工人的演变