Kiro深度体验:亚马逊AI IDE的Spec驱动开发到底强在哪?

亚马逊AWS推出AI IDE Kiro,以Spec驱动开发范式生成生产级代码。
亚马逊AWS发布AI编程工具Kiro,基于VS Code构建,底层使用Claude 4模型。其核心创新是Spec驱动开发模式,严格遵循"需求文档→技术设计→任务拆分→编码→测试"的软件工程流程,区别于Cursor等工具的对话式编程。通过结构化上下文管理,Kiro生成的代码更工程化,适合复杂项目迭代。目前处于内测阶段,定价19美元/月起,稳定性和速度仍有待提升。
亚马逊AWS推出了一款全新的AI IDE——Kiro,它的slogan是"从原型到生产",主打生成可直接上生产环境的代码。与Cursor等AI编程工具不同,Kiro采用了一种"Spec驱动"的开发范式,更贴近真实的软件工程流程。目前Kiro处于内测阶段,底层使用Claude 4模型,未来定价19美元/月起。
值得注意的是,AWS选择Claude 4作为Kiro的底层引擎,与亚马逊对Anthropic的战略投资密切相关——AWS已累计向Anthropic投资超过40亿美元,双方在云计算和AI基础设施层面深度绑定。Claude 4在SWE-bench等主流编程基准测试中表现领先,这也意味着Kiro在模型调用成本和API优先级上具有竞争优势,为未来的定价策略提供了更大的灵活空间。
Kiro的核心理念:计划先行,而非即兴编码
Kiro同样基于VS Code构建,打开项目后可以通过侧边栏的Agent功能进行初始化。它会自动识别项目的产品描述、项目结构和技术架构,这一点类似Claude Code的Init模式。

但真正让Kiro与众不同的是它的编程方式。Kiro提供两种模式:一种是Vibe Coding(氛围编程),适合快速写原型;另一种是Spec模式,这才是它的杀手锏。
Spec模式严格遵循软件工程的标准流程:需求文档 → 技术设计 → 任务拆分 → 编码实现 → 测试验证。这与我们日常后端开发中"接需求→写设计文档→拆模块→编码→测试"的流程完全一致。
Spec驱动开发的工程渊源:Spec驱动开发(Spec-Driven Development)并非Kiro的原创概念,而是软件工程领域数十年积累的最佳实践在AI时代的复兴。传统软件工程中,规格说明书(Specification)是连接业务需求与技术实现的核心桥梁——IEEE 830标准早在1998年就定义了软件需求规格说明的规范格式。Kiro的创新在于将这套严谨的工程方法论与大语言模型的代码生成能力结合,让AI不再是"即兴演奏者",而是遵循乐谱的"专业演奏家"。这种范式的核心价值在于:当需求、设计和任务被显式文档化后,AI模型的每一步输出都有明确的约束边界,从而大幅降低"幻觉"和偏离预期的概率。
实战演示:用Kiro为项目添加谷歌登录
下面用一个实际案例演示Kiro的Spec模式——在一个已有的AI助手项目中增加谷歌登录功能,并建立完整的用户体系,数据库使用MySQL。
第一步:自然语言自动转需求文档
输入自然语言描述后,Kiro首先扮演"产品经理"角色,将需求转化为结构化的需求文档。文档中包含用户故事(User Story)、功能拆分、每个需求的具体描述等。例如:"作为一个法律助手的用户,我想通过谷歌账号登录……"
用户故事(User Story)是敏捷开发方法论中的核心概念,起源于极限编程(XP)实践。它以"作为[角色],我想要[功能],以便[价值]"的格式描述需求,强调从用户视角而非技术视角定义功能边界。Kiro将自然语言自动转化为标准用户故事格式,实际上是在做一次"需求工程自动化"——这在传统开发中需要产品经理和业务分析师花费大量时间完成。

第二步:自动生成技术设计文档
有了需求文档后,Kiro自动进入设计阶段。它会生成:
- 架构概览:认证层、用户管理层、数据管理层、API层、前端层
- 架构图:可视化展示各层之间的关系
- 时序图:描述完整的交互流程
- 组件设计:各模块的详细设计
这些设计文档存储在项目的.kiro目录中,类似Claude Code的记忆存储机制,让Agent始终了解项目上下文和任务进展。
第三步:任务拆分与逐步执行
Kiro将技术方案拆分为具体的开发任务。以谷歌认证模块为例,涉及前端、后端、数据库管理等方面,共被拆分为12个子任务。

每个任务完成后会自动打勾标记,所有测试通过后才算任务完成。这与Claude Code的todo模式有相似之处,但关键区别在于:Kiro是站在后端开发者或标准软件工程师的角色,严格按照需求文档→设计→任务的链路来执行,而不是简单地响应指令。
Kiro的编码质量与上下文管理优势
由于底层同样使用Claude 4模型,Kiro的编码能力与其他同类AI编程工具大致相当。但它的独特优势在于上下文管理。

当前AI编程领域有一个核心课题叫"上下文工程"(Context Engineering)——几乎所有Code Agent场景都依赖上下文来工作。大语言模型的输出质量高度依赖输入上下文的质量和完整性:模型需要知道"做什么"(需求)、"怎么做"(设计)、"现在做到哪了"(任务状态)才能生成高质量代码。Kiro的.kiro目录本质上是一个结构化的上下文存储系统,通过持久化需求文档、设计文档和任务状态,解决了长对话中上下文丢失的核心痛点——这与RAG(检索增强生成)技术的思路异曲同工,只不过检索的对象从外部知识库变成了项目自身的工程文档。
Kiro通过Spec范式(需求→设计→任务)层层递进,使得每一步编码都有充足的上下文支撑,生成的代码也更加工程化和结构化。
从实际代码来看,Kiro修改了大量文件,编码完成后会自动跑测试,确保所有测试通过后才继续下一个任务。这种机制有效减少了AI编程中常见的"写完就跑、不管质量"的问题。
Kiro当前的不足与定价方案
作为内测产品,Kiro目前存在一些明显的不足:
- 稳定性问题:在执行文件编辑等tool call时偶尔会中断,需要手动复制内容重新粘贴继续
- 速度偏慢:由于规划粒度较细(如12个子任务),整体执行时间较长
- 免费额度有限:内测期间每月约50次使用机会
在定价方面,Kiro未来计划推出付费版本:
- 19美元/月:每月1000次请求
- 39美元/月:更高额度(具体待定)
相比Cursor的20美元/月定价,Kiro的入门价格略有优势,但实际性价比还需要看正式版的功能完善程度。
AI IDE市场竞争格局:当前AI IDE市场正经历快速分化——Cursor以对话式编程为核心,月活用户超过100万;GitHub Copilot依托微软生态占据企业市场;Windsurf(原Codeium)主打轻量化体验;Claude Code则以命令行工具形态切入专业开发者市场。Kiro的入场代表着AWS将AI编程工具视为云服务生态的重要入口:开发者一旦习惯在Kiro中构建项目,自然会倾向于将应用部署到AWS云上,形成从开发到部署的完整闭环。这种"以IDE为钩子、以云服务为变现"的战略逻辑,与微软通过GitHub Copilot引流Azure的打法如出一辙。
总结:Spec模式为什么值得开发者关注
Kiro最大的创新在于将软件工程的最佳实践融入AI编程流程。相比Cursor等工具的"对话式编程",Kiro的Spec模式更适合复杂项目的功能迭代和生产级代码开发。它不是简单地让AI写代码,而是让AI像一个资深工程师一样,先理解需求、做好设计、拆分任务,然后再逐步实现。
当然,作为内测产品,稳定性和速度还有很大的提升空间。但这种"计划先行
相关推荐
产品体验Qoder vs Cursor实测对比:同样20美金谁更强?
实测对比Qoder和Cursor两款AI IDE,从Agent自主修复能力、人工沟通次数、架构决策等维度评测。Qoder仅需2次沟通完成任务,Cursor需8次。详细分析两者差异,帮你选择最适合的AI编程工具。
产品体验Cursor云Agent演示:打通软件开发全链路瓶颈
深度解析Cursor云Agent最新Demo,展示如何通过云端虚拟机、自动测试产物和全链路控制平面,系统性消除软件开发生命周期中的人类瓶颈,让Agent自主运行、人按需介入。
产品体验Cursor 3.0深度解析:多Agent并行、Design Mode与Best-of-N模型对比
Cursor 3.0正式发布,从AI辅助编程工具进化为Agent舰队指挥中心。本文详解多智能体并行、Design Mode可视化编辑、Best-of-N多模型择优等核心功能,解读AI编程新范式。