CI/CD已死？AI Agent时代的持续计算架构革命

在AI Engineer大会上，NEA合伙人Madison与Namespace CEO Hugo Santos发表了一场引人深思的演讲：传统CI/CD正在被AI Agent时代的开发节奏彻底击穿，一种全新的"持续计算"架构正在浮现。这不是遥远的未来，而是正在发生的变革。

传统CI/CD为何走向崩溃

人类开发者的节奏已成历史

传统CI/CD流水线的设计逻辑很简单：人类开发者每周提交一到两个PR，同事花时间Review，GitHub Actions执行构建、测试、部署步骤，开发者修复失败的测试用例，然后迭代。这个流程在人类节奏下运转良好——本地缓存可预测，分支管理有序，合并冲突可控。

CI/CD（持续集成/持续部署）的概念最早可追溯到2000年代初期Martin Fowler和Kent Beck在极限编程（XP）中提出的持续集成实践。其核心思想是开发者频繁地将代码集成到共享主干，每次集成都通过自动化构建和测试来验证。随着Docker容器化（2013年）、Jenkins流水线、GitHub Actions（2019年）等工具的成熟，CI/CD演变为现代软件工程的基础设施标配。但这套体系的隐含假设始终未变：变更的生产者是人类，变更的频率、粒度和可预测性都在人类认知带宽之内。整个工具链——从分支策略（Git Flow、Trunk-Based Development）到代码审查机制（Pull Request）——都是围绕人类的工作节奏和协作模式设计的。

但当AI Agent介入后，一切都变了。Agent使用完全相同的系统，却能产生n个PR、跨n个仓库。数千个短生命周期的分支同时拉扯同一个代码库，试图将所有这些不同方向的变更合并在一起变得几乎不可能。

演讲者展示了GitHub近几个月的活动数据：提交数量呈现惊人的飙升曲线，代码新增与删除的行数同样出现了前所未有的峰值。这不是渐进式增长，而是断崖式的范式转变。

GitHub活动数据飙升

合并窗口成为致命瓶颈

Hugo Santos用一个精妙的类比揭示了核心矛盾：PR本质上是为人类Review设计的工作单元，它预期延迟反馈，预期离散的交接流程。而合并操作正在变得越来越像高性能数据库问题——你有一个单一账本（Git仓库），每个变更都需要序列化写入，你需要锁定数据库才能提交。

Git作为分布式版本控制系统，其合并模型本质上是乐观并发控制（Optimistic Concurrency Control）：每个开发者在本地分支上自由修改，只在合并时检测冲突。这与数据库领域的MVCC（多版本并发控制）有相似之处。当并发写入者数量较少时，冲突概率低，乐观策略效率很高。但当并发写入者从几人飙升到数百个Agent时，情况类似于数据库的写入热点问题——所有事务都试图修改同一行数据。Git的三路合并算法（three-way merge）在文本层面解决冲突，但无法理解语义冲突（如两个Agent分别修改了同一个API的调用方和实现方），这使得大规模并行开发下的合并问题远比表面看起来更复杂。

当操作者是人类时，锁定时间长但频率低；当操作者是机器时，锁定时间短但频率极高。合并窗口（opportunity to merge）变得至关重要，因为变更速率急剧增加，任何延迟都会导致级联冲突。

合并窗口的重要性

新架构：从PR驱动到意图驱动

当前的过渡形态

Hugo描述了他们团队和前沿公司（如FAL、ZED、RAMP等）已经在实践的工作方式：没有PR，从意图和计划开始。

整个流程重构为：

意图与计划（Intent & Plan）：明确目标，可能写在Linear工单里，可能在Slack中，但必须被编码化
Agent循环：Agent（可能是Claude Code、AMP、Cursor或Factory）检出代码，开始实现计划
内部验证：Agent利用仓库中已有的资产（构建脚本、测试套件）自行验证变更的正确性
人类确认：Agent完成后告知人类，人类说"continue"——这已经成为最常用的词
合并队列：最终进入账本

Agent循环中的人类确认

未来的终极形态

但这还不够快，因为外部验证环节仍有人类在循环中。Hugo认为在数周到数月内（而非数年），我们将看到：

代码生成：推理速度只会越来越快
内部验证：构建和测试必须极速完成，不能花15分钟甚至45分钟，因为这会拖慢整个循环
外部验证：不再由人类完成，而是由其他专门的Agent执行——安全聚焦的LLM、API一致性检查的LLM，它们在循环内向主Agent提供反馈

关键技术要求是有状态环境。内存重要，状态重要。如果每次都从零开始，延迟将不可接受。Agent需要像工程师在自己的工作站上一样，以增量方式工作。

有状态环境（Stateful Environment）是相对于当前CI/CD中普遍采用的无状态、一次性执行环境而言的。传统CI流水线每次触发都会启动一个全新的容器或虚拟机，从拉取代码、安装依赖、编译构建到运行测试，全部从零开始。这种设计保证了可重复性和隔离性，但代价是巨大的时间开销。增量计算（Incremental Computation）的思想来自构建系统领域——Bazel、Buck等工具通过精确追踪文件依赖图，只重新构建发生变化的部分。将这一理念扩展到Agent的开发循环中，意味着Agent的工作环境需要持久化：文件系统缓存、编译中间产物、依赖树、甚至Agent自身的上下文记忆都应该跨迭代保留。这与云原生时代"牲畜而非宠物"的基础设施哲学形成了有趣的张力——Agent的开发环境更像是需要精心维护的"宠物"，而非用完即弃的"牲畜"。

Pre-Merge队列：新的协调层

由于并行变更数量爆炸式增长，一个全新的概念应运而生——Pre-Merge队列。变更完成后不直接进入仓库，而是进入一个预合并队列。这个队列解决的是序列化问题：保证所有变更能够背靠背地写入账本。

合并队列（Merge Queue）并非全新概念。GitHub于2023年正式推出了Merge Queue功能，Shopify的内部工具、Google的Submit Queue以及Uber的SubmitQueue都是早期实践。其核心机制是：当多个PR同时等待合并时，系统自动将它们排队，依次在最新的主干基础上进行测试验证，确保每个合并后的状态都是绿色的。但传统Merge Queue处理的是每天几十到几百个PR的规模。演讲中提出的Pre-Merge队列需要处理的是数量级更高的变更流，且变更来源是Agent而非人类，这要求队列系统具备更智能的冲突预测、语义分组和优先级调度能力，本质上是将合并协调从简单的FIFO队列升级为一个实时调度系统。

Pre-Merge队列与多变更协调

人类在这个阶段的角色发生了根本转变：不再审查代码本身，而是审查意图与结果的匹配度。结果可能是一段功能运行的视频，可能是安全LLM的分析报告。而且审查的对象不是单个commit或PR，可能是多个Agent独立工作的多个变更被语义化地分组后呈现给人类。

Hugo透露，他们团队的"PR"量已经是之前的4倍，人类审查者不可能逐一查看每个PR。

多元宇宙开发：终极愿景

更激进的设想是"多元宇宙"模式：Agent的起点不再是仓库的最新commit，因为最新commit在不断移动，存在多个候选版本。Agent可能同时在多个commit上工作，针对同一个计划探索不同的实现路径。

这种模式在计算机科学中有深厚的理论根基。它本质上是投机执行（Speculative Execution）的软件工程应用——CPU领域早已通过分支预测和投机执行来提升流水线效率，代价是在预测错误时丢弃已完成的计算。类似地，多个Agent同时探索不同实现路径，最终只采纳最优方案，其余工作被丢弃。这种模式在搜索和优化领域也有对应：蒙特卡洛树搜索（MCTS）通过并行探索多条路径来找到最优解。但与CPU投机执行不同的是，Agent的每次探索都消耗真实的计算资源（GPU推理、云环境运行时间），成本远高于晶体管级别的浪费。这使得探索策略的智能程度——何时分叉、何时剪枝、如何评估候选方案——成为决定这一模式经济可行性的关键因素。

这意味着内部循环必须极快，同时资源消耗也会爆炸式增长——因为你在同时探索大量候选方案。Namespace团队正在投入大量精力维持这个循环的效率：不做不必要的工作，不每次都从零开始，让Agent以增量方式工作。

CI并没有消失，而是融入了循环

演讲最后，Hugo做了一个重要的澄清：CI的核心原则并未消亡，而是发生了位移。

验证不再是独立阶段，而是循环的每次迭代都在进行
不变量仍需强制执行——出于合规原因，你仍需保证从已知的检出点开始，防止未经审查的代码混入
协调从CI中剥离，成为整体循环的一部分
治理被提升到Agent编排层，由harness引导变更遵循团队编码化的流程

Agent编排（Agent Orchestration）是2024-2025年AI工程领域最活跃的方向之一。从LangChain的LangGraph、微软的AutoGen到CrewAI，各种框架试图解决多Agent协作的调度、通信和状态管理问题。演讲中提到的"harness"概念——即一个引导Agent遵循团队编码化流程的治理层——反映了企业级AI采用中的核心关切：可审计性（Auditability）和合规性（Compliance）。在金融、医疗等受监管行业，代码变更必须有清晰的审计轨迹，每一行进入生产环境的代码都需要可追溯到授权的决策。当Agent成为主要的代码生产者时，治理不再是事后的合规检查，而必须内嵌到Agent的每一次决策循环中，这也是为什么演讲者强调治理需要被"提升到Agent编排层"。

这不是CI/CD的消亡，而是它的解构与重组。构建、测试、验证的本质需求永远存在，但承载它们的架构正在从离散的流水线演变为连续的计算循环。正如Hugo所说："这是一个疯狂的世界，我们需要为此做好准备。"

核心要点

传统CI/CD流水线是为人类开发节奏设计的，AI Agent产生的海量并行PR和短生命周期分支正在击穿其设计极限
新架构从PR驱动转向意图驱动，Agent在有状态环境中执行代码生成、内部验证的连续循环，外部验证由专门的安全和合规Agent替代人类
Pre-Merge队列成为新的协调层，解决大量并行变更的序列化合并问题，人类角色从审查代码转变为审查意图与结果的匹配
CI的核心原则（验证、不变量、治理）并未消亡，而是从离散流水线融入连续计算循环中，成为每次迭代的内置环节
未来可能进入多元宇宙开发模式，多个Agent同时在不同commit上探索同一计划的实现路径，对计算资源和循环效率提出极端要求