AWS Kiro深度体验:规范驱动开发vs Cursor,谁更适合你?

Amazon发布AI IDE Kiro,以规范驱动开发挑战Cursor地位
Amazon推出基于VS Code的AI编程工具Kiro,核心卖点是「规范驱动开发」,通过需求定义、设计文档、实现计划三步流程,解决AI编程中代码质量混乱的问题。凭借对Anthropic的巨额投资,Kiro在Claude调用成本上具有结构性优势,瞄准Cursor定价风波后的市场机会,意图将开发者引入AWS生态。目前产品体验潜力不小但打磨不足。
Amazon悄然发布了自己的AI IDE——Kiro,这款基于VS Code的编辑器以「规范驱动开发」(Spec-driven Development)为核心卖点,试图在Cursor、Windsurf、Firebase Studio等一众AI编程工具中杀出一条血路。Fireship频道对其进行了深度体验,本文将梳理Kiro的核心特性、行业背景,以及它到底能不能撼动Cursor的地位。
AI IDE混战:巨头们为何疯狂砸钱
当前AI编程工具领域正在上演一场资本大戏。就在几周前,OpenAI原本计划以数十亿美元收购Windsurf(另一款VS Code分支AI IDE),但交易最终破裂。随后Google介入,以24亿美元的代价挖走了Windsurf的核心人才,而Cognition(Devon的创造者)则以全股票交易的方式收购了剩余资产。

这些天价交易背后的逻辑,需要从VS Code的开源生态说起。VS Code(Visual Studio Code)是微软于2015年开源的代码编辑器,采用MIT许可证发布。其开源特性使得任何团队都可以基于其核心代码库(称为VSCodium或Code-OSS)构建自己的编辑器产品,同时继承VS Code庞大的插件生态和用户习惯。Cursor、Windsurf、Kiro等AI IDE均采用这一策略,本质上是在VS Code的壳子里集成AI能力,从而大幅降低了开发成本和用户迁移门槛。这也解释了为何各大巨头愿意为这些「VS Code分支」支付天价——他们购买的不是编辑器本身,而是已经完成用户教育、建立使用习惯的开发者群体。谁能把开发者锁定在自己的生态系统中,谁就掌握了下一代软件开发的入口。
在这场竞争中,Anthropic凭借Claude Code CLI工具占据了最大的开发者份额——其年收入从去年不到10亿美元飙升至今年超过40亿美元。Anthropic成立于2021年,由前OpenAI研究副总裁Dario Amodei和其妹妹Daniela Amodei联合创立,专注于AI安全研究。Amazon自2023年起开始对Anthropic进行战略投资,累计承诺投入高达80亿美元,并将Claude模型深度集成进AWS的Bedrock平台。这种投资关系使Amazon在Claude的API调用成本上具有结构性优势——作为最大的基础设施提供商和股东,Amazon可以以远低于市场价的成本获取Claude的算力资源。
Cursor的定价困境给了Kiro什么机会
要理解Kiro的战略意图,得先看看Cursor正面临的结构性问题。
Cursor虽然体验出色,但它本质上是Claude的「中间商」——开发者想用Claude写代码,Cursor需要在中间加一层利润才能维持运营。这种商业模式的脆弱性最近暴露得很明显:Cursor尝试调整定价策略,导致部分用户的「氛围编程」(vibe coding)账单突然大幅上涨,最终不得不公开道歉。
「氛围编程」(Vibe Coding)这一术语由OpenAI联合创始人Andrej Karpathy于2025年初提出,描述的是一种完全依赖AI生成代码、开发者几乎不需要理解底层实现的编程方式——用户只需描述想要的功能,AI负责所有代码细节。这种方式极大降低了软件开发门槛,催生了大量个人开发者和非技术背景创业者。然而,氛围编程也暴露出明显局限:当项目规模扩大或需要维护时,AI生成的代码往往缺乏一致的架构设计,技术债务快速累积。正是这种「快速但混乱」的使用模式,导致部分用户的API调用量远超预期,从而引发了Cursor的定价风波。

正是在这个节点上,Amazon推出了Kiro。它同样基于Claude Sonnet 4.0驱动,但由于Amazon本身就是Anthropic的大股东,Kiro在成本控制上天然占优——对Amazon而言,Kiro的真实目标是将开发者引入AWS生态,Claude的调用成本只是获客成本的一部分。从初始定价来看,用户能以更低的价格获得更多的Claude使用量。Amazon选择在Cursor定价风波后发布Kiro,时机上很难说是「纯属巧合」。
Kiro的核心差异:规范驱动开发详解
与Cursor等工具「直接让AI生成代码」的方式不同,Kiro采用了一种更加结构化的AI编程流程,称为规范驱动开发(Spec-driven Development)。
规范驱动开发并非Kiro的全新发明,而是有着深厚的软件工程理论根基。它脱胎于行为驱动开发(BDD)和测试驱动开发(TDD)的思想体系——在编写任何代码之前,先用自然语言或结构化格式明确定义系统行为和验收标准。传统软件工程中的「设计先行」原则(Design First)在大型项目中早已被证明能显著降低返工成本:据麦肯锡研究,软件项目中约45%的缺陷源于需求阶段的模糊定义。Kiro将这一理念与AI代码生成结合,试图解决当前AI编程工具最核心的痛点:AI在没有明确约束时容易生成看似合理但架构混乱的代码,即所谓的「slop」问题。
整个流程分为三个阶段:
第一步:需求定义(Requirements)
Kiro引导开发者首先在requirements.md文件中定义用户故事和验收条件,而不是上来就让AI写代码。这一步的目的是确保开发方向明确,避免AI「跑偏」。
第二步:设计文档(Design)
需求确认后,Kiro会自动生成设计文档,详细描述组件结构、测试策略、错误处理方案等实现细节。这一步相当于传统软件工程中的技术方案评审。
第三步:实现计划(Implementation Plan)
前两份文档合并后生成具体的实现计划,每个任务都会明确标注AI应该编写哪些代码。开发者可以在IDE中逐步点击执行,按计划有序推进。

这种方法的核心理念是防止AI一次性生成大量低质量代码(业内称之为「slop」)。虽然整体流程比Cursor更慢,但对于构建正式项目或多人协作的团队来说,这种「先想清楚再动手」的方式显然更靠谱。
实际上手体验:优势与不足并存
从Fireship的实际体验来看,Kiro目前的表现可以概括为「潜力不小,打磨不够」:
做得好的地方:
- UI设计精美,整体视觉体验在AI IDE中属于上乘
- 规范驱动的开发流程天然适合企业级开发场景
- 当前完全免费使用,试错成本为零
- 官方已表示未来将支持多种AI模型,不会绑死在Claude上

需要改进的地方:
- 整体响应速度偏慢,操作流畅度不如Cursor
- 缺少一些Cursor已有的实用功能,比如聊天检查点(chat checkpoints)
- 服务器过载导致频繁延迟,这在早期产品中比较常见
- 目前仍是闭源产品,模型选择也仅限于Claude
行业格局:开源力量正在改变游戏规则
值得关注的是,就在Kiro发布的同一时期,中国团队推出了Kimi K2——一个开源权重的智能体编程模型,性能已经接近Claude的水平。Kimi K2由月之暗面(
相关推荐
产品体验Qoder vs Cursor实测对比:同样20美金谁更强?
实测对比Qoder和Cursor两款AI IDE,从Agent自主修复能力、人工沟通次数、架构决策等维度评测。Qoder仅需2次沟通完成任务,Cursor需8次。详细分析两者差异,帮你选择最适合的AI编程工具。
产品体验Cursor云Agent演示:打通软件开发全链路瓶颈
深度解析Cursor云Agent最新Demo,展示如何通过云端虚拟机、自动测试产物和全链路控制平面,系统性消除软件开发生命周期中的人类瓶颈,让Agent自主运行、人按需介入。
产品体验Cursor 3.0深度解析:多Agent并行、Design Mode与Best-of-N模型对比
Cursor 3.0正式发布,从AI辅助编程工具进化为Agent舰队指挥中心。本文详解多智能体并行、Design Mode可视化编辑、Best-of-N多模型择优等核心功能,解读AI编程新范式。