AWS Kiro深度体验：规范驱动开发vs Cursor，谁更适合你？

Amazon悄然发布了自己的AI IDE——Kiro，这款基于VS Code的编辑器以「规范驱动开发」（Spec-driven Development）为核心卖点，试图在Cursor、Windsurf、Firebase Studio等一众AI编程工具中杀出一条血路。Fireship频道对其进行了深度体验，本文将梳理Kiro的核心特性、行业背景，以及它到底能不能撼动Cursor的地位。

AI IDE混战：巨头们为何疯狂砸钱

当前AI编程工具领域正在上演一场资本大戏。就在几周前，OpenAI原本计划以数十亿美元收购Windsurf（另一款VS Code分支AI IDE），但交易最终破裂。随后Google介入，以24亿美元的代价挖走了Windsurf的核心人才，而Cognition（Devon的创造者）则以全股票交易的方式收购了剩余资产。

AI IDE行业并购动态

这些天价交易背后的逻辑，需要从VS Code的开源生态说起。VS Code（Visual Studio Code）是微软于2015年开源的代码编辑器，采用MIT许可证发布。其开源特性使得任何团队都可以基于其核心代码库（称为VSCodium或Code-OSS）构建自己的编辑器产品，同时继承VS Code庞大的插件生态和用户习惯。Cursor、Windsurf、Kiro等AI IDE均采用这一策略，本质上是在VS Code的壳子里集成AI能力，从而大幅降低了开发成本和用户迁移门槛。这也解释了为何各大巨头愿意为这些「VS Code分支」支付天价——他们购买的不是编辑器本身，而是已经完成用户教育、建立使用习惯的开发者群体。谁能把开发者锁定在自己的生态系统中，谁就掌握了下一代软件开发的入口。

在这场竞争中，Anthropic凭借Claude Code CLI工具占据了最大的开发者份额——其年收入从去年不到10亿美元飙升至今年超过40亿美元。Anthropic成立于2021年，由前OpenAI研究副总裁Dario Amodei和其妹妹Daniela Amodei联合创立，专注于AI安全研究。Amazon自2023年起开始对Anthropic进行战略投资，累计承诺投入高达80亿美元，并将Claude模型深度集成进AWS的Bedrock平台。这种投资关系使Amazon在Claude的API调用成本上具有结构性优势——作为最大的基础设施提供商和股东，Amazon可以以远低于市场价的成本获取Claude的算力资源。

Cursor的定价困境给了Kiro什么机会

要理解Kiro的战略意图，得先看看Cursor正面临的结构性问题。

Cursor虽然体验出色，但它本质上是Claude的「中间商」——开发者想用Claude写代码，Cursor需要在中间加一层利润才能维持运营。这种商业模式的脆弱性最近暴露得很明显：Cursor尝试调整定价策略，导致部分用户的「氛围编程」（vibe coding）账单突然大幅上涨，最终不得不公开道歉。

「氛围编程」（Vibe Coding）这一术语由OpenAI联合创始人Andrej Karpathy于2025年初提出，描述的是一种完全依赖AI生成代码、开发者几乎不需要理解底层实现的编程方式——用户只需描述想要的功能，AI负责所有代码细节。这种方式极大降低了软件开发门槛，催生了大量个人开发者和非技术背景创业者。然而，氛围编程也暴露出明显局限：当项目规模扩大或需要维护时，AI生成的代码往往缺乏一致的架构设计，技术债务快速累积。正是这种「快速但混乱」的使用模式，导致部分用户的API调用量远超预期，从而引发了Cursor的定价风波。

Cursor定价争议

正是在这个节点上，Amazon推出了Kiro。它同样基于Claude Sonnet 4.0驱动，但由于Amazon本身就是Anthropic的大股东，Kiro在成本控制上天然占优——对Amazon而言，Kiro的真实目标是将开发者引入AWS生态，Claude的调用成本只是获客成本的一部分。从初始定价来看，用户能以更低的价格获得更多的Claude使用量。Amazon选择在Cursor定价风波后发布Kiro，时机上很难说是「纯属巧合」。

Kiro的核心差异：规范驱动开发详解

与Cursor等工具「直接让AI生成代码」的方式不同，Kiro采用了一种更加结构化的AI编程流程，称为规范驱动开发（Spec-driven Development）。

规范驱动开发并非Kiro的全新发明，而是有着深厚的软件工程理论根基。它脱胎于行为驱动开发（BDD）和测试驱动开发（TDD）的思想体系——在编写任何代码之前，先用自然语言或结构化格式明确定义系统行为和验收标准。传统软件工程中的「设计先行」原则（Design First）在大型项目中早已被证明能显著降低返工成本：据麦肯锡研究，软件项目中约45%的缺陷源于需求阶段的模糊定义。Kiro将这一理念与AI代码生成结合，试图解决当前AI编程工具最核心的痛点：AI在没有明确约束时容易生成看似合理但架构混乱的代码，即所谓的「slop」问题。

整个流程分为三个阶段：

第一步：需求定义（Requirements）

Kiro引导开发者首先在requirements.md文件中定义用户故事和验收条件，而不是上来就让AI写代码。这一步的目的是确保开发方向明确，避免AI「跑偏」。

第二步：设计文档（Design）

需求确认后，Kiro会自动生成设计文档，详细描述组件结构、测试策略、错误处理方案等实现细节。这一步相当于传统软件工程中的技术方案评审。

第三步：实现计划（Implementation Plan）

前两份文档合并后生成具体的实现计划，每个任务都会明确标注AI应该编写哪些代码。开发者可以在IDE中逐步点击执行，按计划有序推进。

Kiro的规范驱动开发流程

这种方法的核心理念是防止AI一次性生成大量低质量代码（业内称之为「slop」）。虽然整体流程比Cursor更慢，但对于构建正式项目或多人协作的团队来说，这种「先想清楚再动手」的方式显然更靠谱。

实际上手体验：优势与不足并存

从Fireship的实际体验来看，Kiro目前的表现可以概括为「潜力不小，打磨不够」：

做得好的地方：

UI设计精美，整体视觉体验在AI IDE中属于上乘
规范驱动的开发流程天然适合企业级开发场景
当前完全免费使用，试错成本为零
官方已表示未来将支持多种AI模型，不会绑死在Claude上

Kiro IDE界面

需要改进的地方：

整体响应速度偏慢，操作流畅度不如Cursor
缺少一些Cursor已有的实用功能，比如聊天检查点（chat checkpoints）
服务器过载导致频繁延迟，这在早期产品中比较常见
目前仍是闭源产品，模型选择也仅限于Claude

行业格局：开源力量正在改变游戏规则

值得关注的是，就在Kiro发布的同一时期，中国团队推出了Kimi K2——一个开源权重的智能体编程模型，性能已经接近Claude的水平。Kimi K2由月之暗面（