Claude Sonnet 4深度体验：两条指令复刻Lovable的实战测试

Claude Sonnet 4：当前最强模型的实力展示

2025年6月9日，Anthropic发布了新模型Claude Sonnet 4。这款模型定位高于此前的Opus系列，官方称其为Sonnet系列的全新类别——更大、更贵，但能力也完全是另一个层级。UP主在连续三天的深度使用后给出了极高评价："99.9%的任务里，它就是全球最强。"

Anthropic的模型命名体系借鉴了音乐术语：Haiku（俳句）代表轻量快速，Sonnet（十四行诗）代表均衡实用，Opus（大型乐章）代表最强能力。这一命名逻辑在2024年初确立，每个系列内部再以版本号区分迭代。从2024年中期Anthropic提供Opus、Haiku、Sonnet三档模型，到催生Vibe Coding浪潮的Claude Sonnet 3.5，再到去年底Opus 4.5的巨大飞跃，如今的Sonnet 4已经完全是一种新物种。

所谓Vibe Coding（氛围编程），是2024年由前OpenAI研究员Andrej Karpathy提出的概念，指开发者不再逐行编写代码，而是用自然语言描述需求，让AI模型生成完整的代码实现。开发者的角色从"写代码的人"转变为"描述意图并审查结果的人"。Claude Sonnet 3.5因其出色的代码生成能力，成为这一浪潮的核心推动力，催生了Cursor、Windsurf等一批AI编程工具的爆发式增长。而如今的Sonnet 4，其代码工具能力更上一层楼，能连续长时间工作，空间推理和视觉理解也有显著提升。

不过，这款模型也加入了安全措施。在涉及前沿大模型研究、预训练流程、分布式训练架构等话题时，模型会自动降级或限制能力。这引发了社区不满，但对于绝大多数开发场景来说，Sonnet 4依然是无可匹敌的选择。

实战一：两条指令复刻Lovable全功能界面

UP主用Claude Sonnet 4完成了一项令人惊叹的挑战——仅用两条提示词，就复刻了Lovable（一款知名的AI应用构建平台）的移动端界面和功能。

Lovable（前身为GPT Engineer）是一款基于AI的全栈应用构建平台，用户只需用自然语言描述想要的应用，平台就能自动生成前后端代码并部署上线。它在2024年获得了大量关注，被视为"无代码/低代码"运动的AI进化版，主要面向非技术用户和快速原型开发场景，支持React前端和Supabase后端的自动集成。UP主选择复刻Lovable作为测试，正是因为它本身就是AI开发工具的标杆产品——用AI来复刻AI工具，极具说服力。

看我这边跑得快多了

具体操作非常简单：第一条指令是截图Lovable界面并要求"照着这个样貌重新设计一遍"；第二条指令是"做像Notion的笔记应用，要深色模式"。结果不仅外观高度还原，功能上甚至超越了原版——复刻版支持直接编辑标题和内容、插入表格等功能，而Lovable原版在这些方面反而有所欠缺。

经过八轮提示词迭代后，UP主将这个项目开源（取名"Rileable"蹭了一波热度），它能做网页和手机应用，甚至能在Lovable平台内直接调用Sonnet 4。整个过程使用了Daytona做沙盒、Convex做数据库，生成只花了约45秒。

实战二：复刻McKinsey级别的研究报告

另一个在X平台上接近百万播放的测试更加震撼。UP主将一份格式和图表要求极严的McKinsey风格文档上传给Claude，要求它以相同风格生成一份关于"2026年下半年AI趋势"的研究报告。

McKinsey（麦肯锡）是全球顶级管理咨询公司，其研究报告以严谨的数据分析、精美的可视化图表和深刻的行业洞察著称。一份典型的McKinsey行业研究报告通常需要数周到数月的制作周期，涉及数据采集、专家访谈、模型构建和反复审校，收费从数十万到数百万美元不等。这类报告的核心价值不仅在于内容本身，更在于其标准化的视觉语言——特定的配色方案、图表类型、排版结构已经成为咨询行业的"通用语言"。AI能够复刻这种风格，意味着高端知识工作的门槛正在被大幅降低。

以及视觉风格

生成的23页报告质量惊人：排版清晰、图表精美、每个部分都有评分体系，涵盖了OpenAI与Anthropic的收入对比、数据中心用电量预测、开放权重模型趋势等内容。要知道，McKinsey做这种报告通常收费几十万甚至上百万美元。

UP主还分享了一个实用技巧：先让Claude搜索20个高质量的McKinsey级别报告范例并提供下载链接，下载后作为风格参考拖入对话，再让模型"全力以赴"生成。这个工作流可以保存为"技能"，方便后续复用。

实战三：游戏与城市模拟器开发

除了应用和报告，Claude Sonnet 4在游戏开发方面同样表现出色。UP主用简单指令生成了一个2D Minecraft风格的挖矿游戏，支持角色移动和切换，45秒内完成生成并可直接预览。

毕竟我从来不会玩这些游戏

更令人印象深刻的是，有开发者用Claude Sonnet 4做出了带多智能体交通和延迟检测的城市街区模拟器，包含完整的坐标系统和昼夜切换效果。这些项目大量使用了Three.js等AI Agent越来越擅长的"积木块"技术。

Three.js是一个基于WebGL的JavaScript 3D图形库，它将复杂的底层图形编程抽象为相对简洁的API调用，使得在浏览器中创建3D场景、动画和交互变得可行。对AI Agent而言，Three.js是理想的"积木块"——它有丰富的文档和示例代码作为训练数据，API设计规范且模块化，生成的结果可以直接在浏览器中预览。这解释了为什么AI生成的3D项目越来越常见：不是AI真正"理解"了3D图形学，而是Three.js的抽象层恰好匹配了大语言模型的代码生成能力。

AI Agent积木经济：软件开发的新范式

视频最核心的洞察在于"积木经济"（Building Block Economy）这一概念。Mitchell Hashimoto（HashiCorp联合创始人，Terraform和Vagrant等知名开发工具的创造者）曾撰文指出，AI Agent当下最缺的是强大且可复用的积木块。

这些AI智能体会越来越强

当前的AI Agent开发已经形成了清晰的积木生态：

数据库层：Convex、Supabase、Neon
沙盒环境：Daytona
模型网关：Vercel AI Gateway
托管部署：Vercel
认证组件：Google Sign-in

这些积木块各自解决了AI Agent开发中的关键环节。Convex是一个响应式后端平台，提供实时数据库和无服务器函数，特别适合AI生成的应用，因为它不需要手动管理数据库迁移。Supabase是Firebase的开源替代品，提供PostgreSQL数据库、认证、存储和实时订阅的一站式方案。Neon是无服务器PostgreSQL服务，支持数据库分支功能。Daytona提供标准化的开发环境沙盒，让AI Agent在隔离环境中安全执行代码。Vercel AI Gateway则统一了多个AI模型提供商的API接口，简化了模型调用和切换。这些工具的共同特点是：API优先设计、开箱即用、无需复杂配置——这恰恰是AI Agent高效工作的前提条件。

正如文中所言："既然有Convex、Supabase这些工具，为何还指望AI去重建自己的数据库？"Supabase几乎成了AI Agent做数据库应用的默认选择，已是百亿美元级公司。

代理支付时代：AI Agent自主完成开发闭环

目前AI Agent开发仍有一个瓶颈：注册服务、绑定信用卡、获取API Key等操作仍需人工完成。但UP主透露，他已与多家做"代理支付"的公司接触，未来AI Agent将能自主注册服务、管理预算、甚至在需要时去Fiverr雇人完成任务。

代理支付（Agentic Payments）是AI Agent经济中正在兴起的关键基础设施。当前AI Agent的一个核心限制是"最后一公里"问题：即使模型能力再强，注册第三方服务、完成KYC验证、绑定支付方式、管理API密钥等操作仍需人类手动完成。代理支付解决方案允许AI Agent拥有受控的支付能力——开发者设定预算上限和使用规则，Agent在授权范围内自主决定资源分配。这类似于企业给员工发放有额度限制的公司信用卡。Stripe、PayPal等支付巨头以及一批初创公司正在布局这一赛道，因为它是实现真正自主AI Agent的最后几块拼图之一。

这意味着开发者只需给出预算指令（如"预算100美元，克隆Lovable"），AI Agent就能自动选择最优积木组合、注册必要服务、完成整个应用搭建。这将解锁大量新的产业可能性。

使用建议与成本提醒

Claude Sonnet 4目前可在Claude聊天界面中选择使用，但这个免费/低价窗口只到6月22日，之后将转为API计费，价格比Opus贵两倍。UP主做那个Lovable克隆版花费了约200美元的API额度（约八个提示词的消耗量）。建议趁当前最高或专业版订阅最划算的时候尽快体验。

正如UP主所说："这模型能实现的远超你的想象。"

Claude Sonnet 4深度体验：两条指令复刻Lovable的实战测试

Claude Sonnet 4：当前最强模型的实力展示

实战一：两条指令复刻Lovable全功能界面

实战二：复刻McKinsey级别的研究报告

实战三：游戏与城市模拟器开发

AI Agent积木经济：软件开发的新范式

代理支付时代：AI Agent自主完成开发闭环

使用建议与成本提醒

核心要点

相关推荐

微软Build 2026：自研推理模型MAI Thinking-E及AI全家桶深度解析

Replit领域专用Agent：一键批量修复SEO和安全漏洞

APImart体验：一站式低价调用GPT、Claude等主流大模型