从提示工程师到循环架构师:AI编程的范式转变
从提示工程师到循环架构师:AI编程的范式转变
引言:不再写提示词,而是写循环
Anthropic公司Claude Code负责人Boris Cherny最近分享了一个引人深思的观点:"我不再给Claude写提示词了。我让循环来提示Claude并决定该做什么。我的工作就是写循环。"
这句话看似简单,却揭示了AI编程领域正在发生的一次深刻范式转变——从人类手动编写提示词,到构建能够自主运行、迭代和交付的自动化系统。
什么是循环架构?
Routines:持久化的高阶自动化
Anthropic正在开发一种名为Routines的机制——这是一种持久化的、高阶自动化流程,具备以下特征:
- 异步运行:不需要人类实时在线监督
- 状态监控:持续追踪任务进展和系统状态
- 反馈迭代:根据执行结果自动调整策略
- 高信号筛选:只将真正需要人类判断的关键决策上报审核
Routines的设计理念源自软件工程中长期存在的"编排模式"(Orchestration Pattern)。在微服务架构中,编排器负责协调多个服务的调用顺序和数据流转,而Routines将这一思想应用到了AI Agent领域。与传统的单轮对话或简单的链式调用(Chain)不同,Routines引入了持久化状态管理,这意味着即使在长时间运行的任务中,系统也能记住之前的决策上下文和执行进度。这种设计与Kubernetes中的控制循环(Control Loop)有异曲同工之妙——系统持续比较"期望状态"与"实际状态"之间的差异,并自动采取行动来消除偏差。
这意味着AI不再是一个被动等待指令的工具,而是一个能够自主运行的工作系统。人类的角色从"操作员"转变为"架构师"——设计系统的运行逻辑,而非逐条下达指令。
成熟编码循环的六大要素
一个成熟的AI编码循环需要包含以下核心组件:
- 目标定义:明确循环要达成的最终目标
- 状态与记忆管理:跟踪已完成的工作和当前上下文
- 自我验证:循环能够检验自身输出的质量
- 恢复机制:遇到错误时能够自动回退和修复
- 人机协作升级:识别何时需要人类介入
- 可观测性与成本控制:监控运行状态和资源消耗
其中,自我验证是整个循环架构中最具技术挑战性的环节。循环中的自我验证并非简单地让AI"自己检查自己",而是需要引入多层次的客观验证手段。典型的实现包括:运行自动化测试套件(单元测试、集成测试)来验证代码功能正确性;使用静态分析工具(如ESLint、mypy)检查代码规范和类型安全;通过沙箱环境执行代码并比对预期输出;甚至引入另一个AI实例作为"评审者"进行交叉验证。这种多信号融合的验证策略,本质上借鉴了软件工程中CI/CD(持续集成/持续部署)流水线的设计思想,将质量门禁嵌入到每一轮迭代中。
AI编程的三阶段演进
这一趋势可以概括为三个清晰的阶段:
第一阶段:人类写代码
传统的软件开发模式,程序员直接编写每一行代码。开发效率完全取决于个人的编码能力和领域经验。
第二阶段:人类提示模型写代码
当前大多数开发者所处的阶段——通过精心设计的提示词,让AI模型生成代码。这就是我们熟知的"提示工程"(Prompt Engineering)。提示工程在过去两年中被视为与AI协作的核心技能,其本质是通过精心设计的自然语言指令来引导模型输出。开发者需要掌握上下文窗口管理、少样本示例设计、角色设定等技巧,以获得更高质量的代码生成结果。然而,这种模式的天花板在于——每一次交互仍然依赖人类的实时参与和判断。
第三阶段:构建自主编码系统
开发者构建能够自主提示、迭代、验证和交付代码的系统。人类的工作重心从"写什么"转向"如何让系统自己运转"。在这一阶段,开发者本质上是在设计一个能够自我驱动的软件工程流水线,AI在其中扮演的不再是"助手",而是"执行引擎"。
Token成本:不可忽视的现实约束
避免"昂贵的氛围编程"
Boris Cherny特别强调了一个关键警告:没有良好评估和成本意识的循环,不过是规模化的昂贵氛围编程(vibe coding)。
氛围编程(Vibe Coding)是由前OpenAI研究员、特斯拉AI总监Andrej Karpathy在2025年初提出的概念,指的是开发者完全依赖AI生成代码,自己不仔细审查逻辑,仅凭"感觉"(vibe)判断代码是否可用。这种方式在快速原型开发中有一定价值,但在生产环境中存在严重隐患——代码可能包含隐蔽的逻辑错误、安全漏洞或性能问题。当这种随意的方式被放入自动化循环中规模化运行时,问题会被成倍放大:系统可能在错误的方向上持续迭代,每次迭代都消耗大量Token,最终产生的代码既昂贵又不可靠。
这一点至关重要。当循环自动运行时,Token消耗可能呈指数级增长。Token是大语言模型处理文本的基本计量单位,通常一个英文单词对应1-2个Token,一个中文字符对应1-3个Token。以Claude等前沿模型为例,每百万输入Token的费用在3-15美元之间,输出Token的费用更高。在自动化循环中,每一轮迭代都涉及大量的上下文传递、代码生成和结果分析,单次循环可能消耗数万甚至数十万Token。如果循环设计不当——比如缺乏有效的终止条件或陷入无效重试——一个过夜运行的任务可能轻松产生数百美元的API费用,而产出却毫无价值。
如果缺乏有效的评估机制,系统可能在错误的方向上消耗大量资源,却产出低质量的结果。因此,成本控制和质量评估不是可选项,而是循环架构的核心组成部分。开发者需要为每个循环设定明确的预算上限、质量阈值和终止条件。
对开发者的启示
这一范式转变对整个开发者群体意味着什么?
首先,技能重心正在转移。未来最有价值的能力不是写出完美的提示词,而是设计高效的自动化循环——包括状态管理、错误恢复、质量评估等系统工程能力。循环架构要求的是一套截然不同的能力体系:状态机设计(定义系统在不同阶段的行为)、容错与重试策略(如指数退避算法——每次重试间隔按指数增长,避免在服务不可用时造成请求风暴)、资源预算管理、以及可观测性工程(通过日志、指标和追踪来监控系统行为)。这些能力更接近传统的分布式系统工程和SRE(站点可靠性工程,Site Reliability Engineering)领域,而非自然语言处理。这意味着具备系统架构背景的工程师在这一范式转变中可能拥有天然优势。
其次,人类的角色更加战略化。开发者将更多地关注系统设计、目标定义和异常处理策略,而非具体的实现细节。这与管理学中的"管理幅度"概念类似——当下属(AI循环)足够可靠时,管理者(开发者)可以将注意力集中在更高层次的决策上,而非事无巨细地监督每一步执行。
最后,评估能力成为核心竞争力。在循环自主运行的世界里,能够准确评估AI输出质量、设计有效的验证机制,将成为区分优秀开发者的关键能力。这包括设计定量的评估指标(如代码通过测试的比率、生成代码的圈复杂度、安全扫描通过率等),以及建立基准测试集来持续衡量循环系统的性能表现。没有可靠的评估体系,循环就是一个"黑箱"——你无法知道它是在创造价值还是在烧钱。
总结
从"提示工程师"到"循环架构师"的转变,不仅仅是工具使用方式的改变,更是人机协作模式的根本性重构。Anthropic通过Routines机制展示的方向,很可能代表了AI辅助编程的下一个主流范式。对于开发者而言,现在就开始思考如何设计、评估和优化这些自动化循环,将是保持竞争力的关键。值得注意的是,这一趋势并非要取代开发者,而是将开发者的价值锚点从"代码生产"提升到"系统设计"——正如工业革命并未消灭工人,而是将人类从重复劳动中解放出来,转向更高层次的创造性工作。
核心要点
相关推荐

AITS实测:API+Web+App自动化测试一站式搞定
深度实测AITS智能测试平台,覆盖API接口自动化、Web自动化、App真机云测及性能压测全链路。详解智能驾驶舱、断言规则复用、脚本自动生成等核心功能,帮助测试团队告别重复劳动,提升测试效率。

Codex vs Claude Code vs Cursor:AI编程工具怎么选
深度对比Codex、Claude Code和Cursor三大AI编程工具的价格、稳定性与能力差异。Codex擅长前端UI开发,Claude Code后端逻辑更强,Cursor老牌稳定。帮你根据开发方向选出最适合的AI编程助手。

Hermes Jarvis深度解析:语音驱动的AI全能助手
深度解析Hermes Jarvis语音AI助手的核心功能与五层架构设计。从语音开发应用、系统级操控到多模型集成,全面了解这款将科幻变为现实的智能体助手的能力、局限与未来潜力。