Bolt实战测评:氛围编程能用来做项目吗?

氛围编程通过自然语言对话生成应用,快速但存在代码质量隐患。
氛围编程(Vibe Coding)是由Andrej Karpathy提出的一种完全依赖自然语言与AI对话生成应用的开发方式。文章通过使用Bolt.new构建复古游戏博客的实战,展示了其快速生成完整应用的能力,但也暴露了核心痛点:自然语言的模糊性导致反复迭代,AI生成的代码存在"上帝文件"等质量问题。氛围编程适合快速原型验证,但不适合需要长期维护的复杂商业项目。
什么是氛围编程(Vibe Coding)
氛围编程(Vibe Coding)是一种完全依赖自然语言与AI对话来生成应用程序的开发方式。开发者无需手写代码,只需通过聊天描述需求,AI工具就会从零开始生成完整的应用。在理想状态下,你甚至不需要查看代码本身——只需要「聊天聊到上线」。
这个概念由AI研究员Andrej Karpathy于2025年初在社交媒体上提出。Karpathy曾任特斯拉AI总监和OpenAI联合创始人,他用这个词描述一种「完全沉浸在氛围中,忘记代码本身存在」的编程体验。这一术语迅速在开发者社区引发广泛讨论,折射出大语言模型代码生成能力的飞跃——从GitHub Copilot的行级补全,到如今能够生成完整应用的全栈AI工具,整个行业在短短两三年内经历了范式级别的转变。
这个概念听起来很美好,但正如视频作者所言,这个术语本身就让人有些尴尬——它听起来像是「技术债务的委婉说法,配上了Lo-Fi背景音乐」。不过,如果你对所使用的技术栈有一定了解,氛围编程确实能帮助你快速启动项目。
用Bolt.new构建复古游戏博客:完整实战过程
初始提示与AI增强功能
本次实战选择了Bolt(bolt.new)作为氛围编程平台。Bolt由StackBlitz团队开发,其核心技术亮点在于将完整的Node.js运行时环境搬进了浏览器——这依赖于WebContainers技术,一种基于WebAssembly实现的浏览器内操作系统沙箱,代码的安装、编译和运行全部在浏览器本地完成,无需传统的云端服务器。在AI层面,Bolt集成了Anthropic的Claude模型作为代码生成引擎。Bolt是众多AI编程工具之一,其他类似工具还包括Lovable(基于GPT-4)和Replit等,不同工具在底层模型选择、上下文窗口管理和代码执行环境上各有侧重。
作者的初始提示非常简洁:
"我想要一个复古游戏博客,可以添加新文章,其他用户可以评论。使用复古风格字体和像素图标。"

Bolt提供了一个「AI增强提示」功能,它会自动扩展你的简单描述,补充更多细节——包括多页面结构(首页、文章页、管理后台)、设计要求、技术实现方案和内容结构等。这意味着你不仅在「氛围编程」,还在「氛围提示」。
首次生成结果:惊喜与落差
Bolt在思考11秒后,制定了实施计划,安装了所有依赖,创建了文件并运行了应用。生成的结果看起来像一个游戏界面本身——完整的复古风格,甚至还有点击时的音效提示。

页面功能基本完整:首页展示文章列表,点击「Read More」可以进入详情页,整体交互流畅。但问题在于——它看起来太像一台90年代的电脑界面了,而作者想要的是「现代设计中带有复古元素的点缀」。
迭代调整暴露的核心痛点
接下来的调整过程暴露了氛围编程最大的问题——自然语言的模糊性。这一问题在计算语言学中有其深层根源:人类语言天然具有语境依赖性和主观性,「更现代」「复古点缀」「更多」这类表达在不同人的心智模型中对应着截然不同的视觉预期。当前的大语言模型本质上是在做概率预测,它会根据训练数据中「现代设计」的统计分布来解读指令,而非真正理解你脑海中的具体画面。这也是为什么提示工程(Prompt Engineering)逐渐发展成一门独立学科——如何将模糊的人类意图转化为AI能够精确执行的结构化指令,本身就是一项需要刻意练习的技能。
具体的迭代过程如下:
- 第一次调整:要求「更现代,只是致敬复古游戏」——结果样式完全没有被应用
- 第二次调整:指出样式未生效——修复后又走向另一个极端,变得过于平淡无趣
- 第三次调整:要求「在两者之间找个平衡」——效果有所改善
- 第四次调整:要求复古字体和像素表情——AI添加的表情数量远少于预期

当你说「更多像素表情」时,AI对「更多」的理解可能和你完全不同。提供参考图片、使用具体的设计系统术语(如「Material Design风格」)或引用具体网站,往往比抽象描述更有效。每一次调整都像是在和一个理解力有限的设计师沟通——你知道你想要什么,但很难用文字精确传达。这是当前所有氛围编程工具面临的共同挑战。
Bolt的核心功能详解
除了基本的对话式开发,Bolt还提供了几个值得关注的辅助功能:
集成与元素检查器
- 第三方集成:支持Stripe、Supabase、GitHub等服务的直接接入
- 元素检查器:可以选中页面上的特定元素,将其作为上下文提供给AI,实现更精准的局部调整
- 设备预览:支持不同设备尺寸的响应式预览
- 独立浏览器预览:可以在新标签页中打开完整应用

知识库配置
Bolt的设置中有一个「Knowledge」板块,包含两个层级:
- 全局系统提示:适用于所有项目的通用指令(如「使用Tailwind进行样式设计」)
- 项目专属提示:针对特定项目的上下文信息
合理配置知识库能让AI更好地理解你的偏好和项目需求,显著减少重复沟通的成本。
氛围编程的局限性:哪些场景不该用
代码质量难以保证
查看Bolt生成的代码会发现一个明显问题:它倾向于将大量代码堆积在单个文件中。在软件工程中,这种模式被称为「上帝文件」(God File)反模式——一个文件承担了过多职责,违反了单一职责原则(SRP)。这种代码结构在项目初期运行正常,但随着功能增长,会导致可读性下降、测试困难、合并冲突频繁等问题。
从更宏观的视角看,这揭示了当前AI代码生成工具的一个系统性局限:它们优化的目标是「让代码跑起来」,而非「让代码易于维护」。专业软件工程中的SOLID原则、设计模式、模块化架构等最佳实践,需要对整个代码库有全局视野,这恰恰是当前受限于上下文窗口的AI模型最难做到的事情。随着功能增加,这种结构会导致严重的技术债务,后期维护成本极高。
适用场景与不适用场景
氛围编程适合这些情况:
- 快速原型验证和概念演示
- 简单应用和个人项目
- 有技术背景的开发者用来加速启动(能引导AI做出更好的决策,也能在需要时手动修复代码)
以下场景建议谨慎使用:
- 复杂的客户项目或商业产品
- 需要长期维护和迭代的应用
- 对代码质量、安
相关推荐
产品体验Qoder vs Cursor实测对比:同样20美金谁更强?
实测对比Qoder和Cursor两款AI IDE,从Agent自主修复能力、人工沟通次数、架构决策等维度评测。Qoder仅需2次沟通完成任务,Cursor需8次。详细分析两者差异,帮你选择最适合的AI编程工具。
产品体验Cursor云Agent演示:打通软件开发全链路瓶颈
深度解析Cursor云Agent最新Demo,展示如何通过云端虚拟机、自动测试产物和全链路控制平面,系统性消除软件开发生命周期中的人类瓶颈,让Agent自主运行、人按需介入。
产品体验Cursor 3.0深度解析:多Agent并行、Design Mode与Best-of-N模型对比
Cursor 3.0正式发布,从AI辅助编程工具进化为Agent舰队指挥中心。本文详解多智能体并行、Design Mode可视化编辑、Best-of-N多模型择优等核心功能,解读AI编程新范式。