CI/CD已死?AI Agent时代的持续计算架构革命

AI Agent时代正将传统CI/CD从离散流水线重构为意图驱动的连续计算循环
传统CI/CD流水线为人类开发节奏设计,AI Agent产生的海量并行变更正击穿其设计极限。新架构从PR驱动转向意图驱动,Agent在有状态环境中执行代码生成与验证的连续循环,外部验证由专门Agent替代人类。Pre-Merge队列解决并行变更的序列化合并问题,人类角色从审查代码转为审查意图与结果匹配。CI核心原则未消亡,而是融入连续计算循环。
在AI Engineer大会上,NEA合伙人Madison与Namespace CEO Hugo Santos发表了一场引人深思的演讲:传统CI/CD正在被AI Agent时代的开发节奏彻底击穿,一种全新的"持续计算"架构正在浮现。这不是遥远的未来,而是正在发生的变革。
传统CI/CD为何走向崩溃
人类开发者的节奏已成历史
传统CI/CD流水线的设计逻辑很简单:人类开发者每周提交一到两个PR,同事花时间Review,GitHub Actions执行构建、测试、部署步骤,开发者修复失败的测试用例,然后迭代。这个流程在人类节奏下运转良好——本地缓存可预测,分支管理有序,合并冲突可控。
CI/CD(持续集成/持续部署)的概念最早可追溯到2000年代初期Martin Fowler和Kent Beck在极限编程(XP)中提出的持续集成实践。其核心思想是开发者频繁地将代码集成到共享主干,每次集成都通过自动化构建和测试来验证。随着Docker容器化(2013年)、Jenkins流水线、GitHub Actions(2019年)等工具的成熟,CI/CD演变为现代软件工程的基础设施标配。但这套体系的隐含假设始终未变:变更的生产者是人类,变更的频率、粒度和可预测性都在人类认知带宽之内。整个工具链——从分支策略(Git Flow、Trunk-Based Development)到代码审查机制(Pull Request)——都是围绕人类的工作节奏和协作模式设计的。
但当AI Agent介入后,一切都变了。Agent使用完全相同的系统,却能产生n个PR、跨n个仓库。数千个短生命周期的分支同时拉扯同一个代码库,试图将所有这些不同方向的变更合并在一起变得几乎不可能。
演讲者展示了GitHub近几个月的活动数据:提交数量呈现惊人的飙升曲线,代码新增与删除的行数同样出现了前所未有的峰值。这不是渐进式增长,而是断崖式的范式转变。

合并窗口成为致命瓶颈
Hugo Santos用一个精妙的类比揭示了核心矛盾:PR本质上是为人类Review设计的工作单元,它预期延迟反馈,预期离散的交接流程。而合并操作正在变得越来越像高性能数据库问题——你有一个单一账本(Git仓库),每个变更都需要序列化写入,你需要锁定数据库才能提交。
Git作为分布式版本控制系统,其合并模型本质上是乐观并发控制(Optimistic Concurrency Control):每个开发者在本地分支上自由修改,只在合并时检测冲突。这与数据库领域的MVCC(多版本并发控制)有相似之处。当并发写入者数量较少时,冲突概率低,乐观策略效率很高。但当并发写入者从几人飙升到数百个Agent时,情况类似于数据库的写入热点问题——所有事务都试图修改同一行数据。Git的三路合并算法(three-way merge)在文本层面解决冲突,但无法理解语义冲突(如两个Agent分别修改了同一个API的调用方和实现方),这使得大规模并行开发下的合并问题远比表面看起来更复杂。
当操作者是人类时,锁定时间长但频率低;当操作者是机器时,锁定时间短但频率极高。合并窗口(opportunity to merge)变得至关重要,因为变更速率急剧增加,任何延迟都会导致级联冲突。

新架构:从PR驱动到意图驱动
当前的过渡形态
Hugo描述了他们团队和前沿公司(如FAL、ZED、RAMP等)已经在实践的工作方式:没有PR,从意图和计划开始。
整个流程重构为:
- 意图与计划(Intent & Plan):明确目标,可能写在Linear工单里,可能在Slack中,但必须被编码化
- Agent循环:Agent(可能是Claude Code、AMP、Cursor或Factory)检出代码,开始实现计划
- 内部验证:Agent利用仓库中已有的资产(构建脚本、测试套件)自行验证变更的正确性
- 人类确认:Agent完成后告知人类,人类说"continue"——这已经成为最常用的词
- 合并队列:最终进入账本

未来的终极形态
但这还不够快,因为外部验证环节仍有人类在循环中。Hugo认为在数周到数月内(而非数年),我们将看到:
- 代码生成:推理速度只会越来越快
- 内部验证:构建和测试必须极速完成,不能花15分钟甚至45分钟,因为这会拖慢整个循环
- 外部验证:不再由人类完成,而是由其他专门的Agent执行——安全聚焦的LLM、API一致性检查的LLM,它们在循环内向主Agent提供反馈
关键技术要求是有状态环境。内存重要,状态重要。如果每次都从零开始,延迟将不可接受。Agent需要像工程师在自己的工作站上一样,以增量方式工作。
有状态环境(Stateful Environment)是相对于当前CI/CD中普遍采用的无状态、一次性执行环境而言的。传统CI流水线每次触发都会启动一个全新的容器或虚拟机,从拉取代码、安装依赖、编译构建到运行测试,全部从零开始。这种设计保证了可重复性和隔离性,但代价是巨大的时间开销。增量计算(Incremental Computation)的思想来自构建系统领域——Bazel、Buck等工具通过精确追踪文件依赖图,只重新构建发生变化的部分。将这一理念扩展到Agent的开发循环中,意味着Agent的工作环境需要持久化:文件系统缓存、编译中间产物、依赖树、甚至Agent自身的上下文记忆都应该跨迭代保留。这与云原生时代"牲畜而非宠物"的基础设施哲学形成了有趣的张力——Agent的开发环境更像是需要精心维护的"宠物",而非用完即弃的"牲畜"。
Pre-Merge队列:新的协调层
由于并行变更数量爆炸式增长,一个全新的概念应运而生——Pre-Merge队列。变更完成后不直接进入仓库,而是进入一个预合并队列。这个队列解决的是序列化问题:保证所有变更能够背靠背地写入账本。
合并队列(Merge Queue)并非全新概念。GitHub于2023年正式推出了Merge Queue功能,Shopify的内部工具、Google的Submit Queue以及Uber的SubmitQueue都是早期实践。其核心机制是:当多个PR同时等待合并时,系统自动将它们排队,依次在最新的主干基础上进行测试验证,确保每个合并后的状态都是绿色的。但传统Merge Queue处理的是每天几十到几百个PR的规模。演讲中提出的Pre-Merge队列需要处理的是数量级更高的变更流,且变更来源是Agent而非人类,这要求队列系统具备更智能的冲突预测、语义分组和优先级调度能力,本质上是将合并协调从简单的FIFO队列升级为一个实时调度系统。

人类在这个阶段的角色发生了根本转变:不再审查代码本身,而是审查意图与结果的匹配度。结果可能是一段功能运行的视频,可能是安全LLM的分析报告。而且审查的对象不是单个commit或PR,可能是多个Agent独立工作的多个变更被语义化地分组后呈现给人类。
Hugo透露,他们团队的"PR"量已经是之前的4倍,人类审查者不可能逐一查看每个PR。
多元宇宙开发:终极愿景
更激进的设想是"多元宇宙"模式:Agent的起点不再是仓库的最新commit,因为最新commit在不断移动,存在多个候选版本。Agent可能同时在多个commit上工作,针对同一个计划探索不同的实现路径。
这种模式在计算机科学中有深厚的理论根基。它本质上是投机执行(Speculative Execution)的软件工程应用——CPU领域早已通过分支预测和投机执行来提升流水线效率,代价是在预测错误时丢弃已完成的计算。类似地,多个Agent同时探索不同实现路径,最终只采纳最优方案,其余工作被丢弃。这种模式在搜索和优化领域也有对应:蒙特卡洛树搜索(MCTS)通过并行探索多条路径来找到最优解。但与CPU投机执行不同的是,Agent的每次探索都消耗真实的计算资源(GPU推理、云环境运行时间),成本远高于晶体管级别的浪费。这使得探索策略的智能程度——何时分叉、何时剪枝、如何评估候选方案——成为决定这一模式经济可行性的关键因素。
这意味着内部循环必须极快,同时资源消耗也会爆炸式增长——因为你在同时探索大量候选方案。Namespace团队正在投入大量精力维持这个循环的效率:不做不必要的工作,不每次都从零开始,让Agent以增量方式工作。
CI并没有消失,而是融入了循环
演讲最后,Hugo做了一个重要的澄清:CI的核心原则并未消亡,而是发生了位移。
- 验证不再是独立阶段,而是循环的每次迭代都在进行
- 不变量仍需强制执行——出于合规原因,你仍需保证从已知的检出点开始,防止未经审查的代码混入
- 协调从CI中剥离,成为整体循环的一部分
- 治理被提升到Agent编排层,由harness引导变更遵循团队编码化的流程
Agent编排(Agent Orchestration)是2024-2025年AI工程领域最活跃的方向之一。从LangChain的LangGraph、微软的AutoGen到CrewAI,各种框架试图解决多Agent协作的调度、通信和状态管理问题。演讲中提到的"harness"概念——即一个引导Agent遵循团队编码化流程的治理层——反映了企业级AI采用中的核心关切:可审计性(Auditability)和合规性(Compliance)。在金融、医疗等受监管行业,代码变更必须有清晰的审计轨迹,每一行进入生产环境的代码都需要可追溯到授权的决策。当Agent成为主要的代码生产者时,治理不再是事后的合规检查,而必须内嵌到Agent的每一次决策循环中,这也是为什么演讲者强调治理需要被"提升到Agent编排层"。
这不是CI/CD的消亡,而是它的解构与重组。构建、测试、验证的本质需求永远存在,但承载它们的架构正在从离散的流水线演变为连续的计算循环。正如Hugo所说:"这是一个疯狂的世界,我们需要为此做好准备。"
核心要点
- 传统CI/CD流水线是为人类开发节奏设计的,AI Agent产生的海量并行PR和短生命周期分支正在击穿其设计极限
- 新架构从PR驱动转向意图驱动,Agent在有状态环境中执行代码生成、内部验证的连续循环,外部验证由专门的安全和合规Agent替代人类
- Pre-Merge队列成为新的协调层,解决大量并行变更的序列化合并问题,人类角色从审查代码转变为审查意图与结果的匹配
- CI的核心原则(验证、不变量、治理)并未消亡,而是从离散流水线融入连续计算循环中,成为每次迭代的内置环节
- 未来可能进入多元宇宙开发模式,多个Agent同时在不同commit上探索同一计划的实现路径,对计算资源和循环效率提出极端要求
相关推荐
观点碰撞Windsurf CEO深度访谈:速度是唯一的护城河
Windsurf CEO Varun Mohan深度访谈,分享AI编程IDE的创业pivot经验、产品构建方法论、异步Agent挑战,以及与Cursor竞争的差异化策略。速度才是创业公司唯一的护城河。
观点碰撞被低估即自由:AI时代的逆向竞争哲学
探讨AI行业中"被低估即自由"的逆向竞争策略。从OpenAI、DeepSeek到Cursor,解析为何低调积蓄力量比站在风口浪尖更具战略优势,以及这一哲学对AI创业者和从业者的深刻启示。
观点碰撞新教工作伦理如何被劫持:从保护工人到压迫工人的演变
哲学家Elizabeth Anderson揭示新教工作伦理如何从保护工人的理想被扭曲为压迫工具。从清教徒的公平商业伦理到新自由主义的复活,深度解析工作伦理的历史演变及其对AI时代劳动关系的启示。