Claude Sonnet 4深度体验:两条指令复刻Lovable的实战测试

Claude Sonnet 4:当前最强模型的实力展示
2025年6月9日,Anthropic发布了新模型Claude Sonnet 4。这款模型定位高于此前的Opus系列,官方称其为Sonnet系列的全新类别——更大、更贵,但能力也完全是另一个层级。UP主在连续三天的深度使用后给出了极高评价:"99.9%的任务里,它就是全球最强。"
Anthropic的模型命名体系借鉴了音乐术语:Haiku(俳句)代表轻量快速,Sonnet(十四行诗)代表均衡实用,Opus(大型乐章)代表最强能力。这一命名逻辑在2024年初确立,每个系列内部再以版本号区分迭代。从2024年中期Anthropic提供Opus、Haiku、Sonnet三档模型,到催生Vibe Coding浪潮的Claude Sonnet 3.5,再到去年底Opus 4.5的巨大飞跃,如今的Sonnet 4已经完全是一种新物种。
所谓Vibe Coding(氛围编程),是2024年由前OpenAI研究员Andrej Karpathy提出的概念,指开发者不再逐行编写代码,而是用自然语言描述需求,让AI模型生成完整的代码实现。开发者的角色从"写代码的人"转变为"描述意图并审查结果的人"。Claude Sonnet 3.5因其出色的代码生成能力,成为这一浪潮的核心推动力,催生了Cursor、Windsurf等一批AI编程工具的爆发式增长。而如今的Sonnet 4,其代码工具能力更上一层楼,能连续长时间工作,空间推理和视觉理解也有显著提升。
不过,这款模型也加入了安全措施。在涉及前沿大模型研究、预训练流程、分布式训练架构等话题时,模型会自动降级或限制能力。这引发了社区不满,但对于绝大多数开发场景来说,Sonnet 4依然是无可匹敌的选择。
实战一:两条指令复刻Lovable全功能界面
UP主用Claude Sonnet 4完成了一项令人惊叹的挑战——仅用两条提示词,就复刻了Lovable(一款知名的AI应用构建平台)的移动端界面和功能。
Lovable(前身为GPT Engineer)是一款基于AI的全栈应用构建平台,用户只需用自然语言描述想要的应用,平台就能自动生成前后端代码并部署上线。它在2024年获得了大量关注,被视为"无代码/低代码"运动的AI进化版,主要面向非技术用户和快速原型开发场景,支持React前端和Supabase后端的自动集成。UP主选择复刻Lovable作为测试,正是因为它本身就是AI开发工具的标杆产品——用AI来复刻AI工具,极具说服力。

具体操作非常简单:第一条指令是截图Lovable界面并要求"照着这个样貌重新设计一遍";第二条指令是"做像Notion的笔记应用,要深色模式"。结果不仅外观高度还原,功能上甚至超越了原版——复刻版支持直接编辑标题和内容、插入表格等功能,而Lovable原版在这些方面反而有所欠缺。
经过八轮提示词迭代后,UP主将这个项目开源(取名"Rileable"蹭了一波热度),它能做网页和手机应用,甚至能在Lovable平台内直接调用Sonnet 4。整个过程使用了Daytona做沙盒、Convex做数据库,生成只花了约45秒。
实战二:复刻McKinsey级别的研究报告
另一个在X平台上接近百万播放的测试更加震撼。UP主将一份格式和图表要求极严的McKinsey风格文档上传给Claude,要求它以相同风格生成一份关于"2026年下半年AI趋势"的研究报告。
McKinsey(麦肯锡)是全球顶级管理咨询公司,其研究报告以严谨的数据分析、精美的可视化图表和深刻的行业洞察著称。一份典型的McKinsey行业研究报告通常需要数周到数月的制作周期,涉及数据采集、专家访谈、模型构建和反复审校,收费从数十万到数百万美元不等。这类报告的核心价值不仅在于内容本身,更在于其标准化的视觉语言——特定的配色方案、图表类型、排版结构已经成为咨询行业的"通用语言"。AI能够复刻这种风格,意味着高端知识工作的门槛正在被大幅降低。

生成的23页报告质量惊人:排版清晰、图表精美、每个部分都有评分体系,涵盖了OpenAI与Anthropic的收入对比、数据中心用电量预测、开放权重模型趋势等内容。要知道,McKinsey做这种报告通常收费几十万甚至上百万美元。
UP主还分享了一个实用技巧:先让Claude搜索20个高质量的McKinsey级别报告范例并提供下载链接,下载后作为风格参考拖入对话,再让模型"全力以赴"生成。这个工作流可以保存为"技能",方便后续复用。
实战三:游戏与城市模拟器开发
除了应用和报告,Claude Sonnet 4在游戏开发方面同样表现出色。UP主用简单指令生成了一个2D Minecraft风格的挖矿游戏,支持角色移动和切换,45秒内完成生成并可直接预览。

更令人印象深刻的是,有开发者用Claude Sonnet 4做出了带多智能体交通和延迟检测的城市街区模拟器,包含完整的坐标系统和昼夜切换效果。这些项目大量使用了Three.js等AI Agent越来越擅长的"积木块"技术。
Three.js是一个基于WebGL的JavaScript 3D图形库,它将复杂的底层图形编程抽象为相对简洁的API调用,使得在浏览器中创建3D场景、动画和交互变得可行。对AI Agent而言,Three.js是理想的"积木块"——它有丰富的文档和示例代码作为训练数据,API设计规范且模块化,生成的结果可以直接在浏览器中预览。这解释了为什么AI生成的3D项目越来越常见:不是AI真正"理解"了3D图形学,而是Three.js的抽象层恰好匹配了大语言模型的代码生成能力。
AI Agent积木经济:软件开发的新范式
视频最核心的洞察在于"积木经济"(Building Block Economy)这一概念。Mitchell Hashimoto(HashiCorp联合创始人,Terraform和Vagrant等知名开发工具的创造者)曾撰文指出,AI Agent当下最缺的是强大且可复用的积木块。

当前的AI Agent开发已经形成了清晰的积木生态:
- 数据库层:Convex、Supabase、Neon
- 沙盒环境:Daytona
- 模型网关:Vercel AI Gateway
- 托管部署:Vercel
- 认证组件:Google Sign-in
这些积木块各自解决了AI Agent开发中的关键环节。Convex是一个响应式后端平台,提供实时数据库和无服务器函数,特别适合AI生成的应用,因为它不需要手动管理数据库迁移。Supabase是Firebase的开源替代品,提供PostgreSQL数据库、认证、存储和实时订阅的一站式方案。Neon是无服务器PostgreSQL服务,支持数据库分支功能。Daytona提供标准化的开发环境沙盒,让AI Agent在隔离环境中安全执行代码。Vercel AI Gateway则统一了多个AI模型提供商的API接口,简化了模型调用和切换。这些工具的共同特点是:API优先设计、开箱即用、无需复杂配置——这恰恰是AI Agent高效工作的前提条件。
正如文中所言:"既然有Convex、Supabase这些工具,为何还指望AI去重建自己的数据库?"Supabase几乎成了AI Agent做数据库应用的默认选择,已是百亿美元级公司。
代理支付时代:AI Agent自主完成开发闭环
目前AI Agent开发仍有一个瓶颈:注册服务、绑定信用卡、获取API Key等操作仍需人工完成。但UP主透露,他已与多家做"代理支付"的公司接触,未来AI Agent将能自主注册服务、管理预算、甚至在需要时去Fiverr雇人完成任务。
代理支付(Agentic Payments)是AI Agent经济中正在兴起的关键基础设施。当前AI Agent的一个核心限制是"最后一公里"问题:即使模型能力再强,注册第三方服务、完成KYC验证、绑定支付方式、管理API密钥等操作仍需人类手动完成。代理支付解决方案允许AI Agent拥有受控的支付能力——开发者设定预算上限和使用规则,Agent在授权范围内自主决定资源分配。这类似于企业给员工发放有额度限制的公司信用卡。Stripe、PayPal等支付巨头以及一批初创公司正在布局这一赛道,因为它是实现真正自主AI Agent的最后几块拼图之一。
这意味着开发者只需给出预算指令(如"预算100美元,克隆Lovable"),AI Agent就能自动选择最优积木组合、注册必要服务、完成整个应用搭建。这将解锁大量新的产业可能性。
使用建议与成本提醒
Claude Sonnet 4目前可在Claude聊天界面中选择使用,但这个免费/低价窗口只到6月22日,之后将转为API计费,价格比Opus贵两倍。UP主做那个Lovable克隆版花费了约200美元的API额度(约八个提示词的消耗量)。建议趁当前最高或专业版订阅最划算的时候尽快体验。
正如UP主所说:"这模型能实现的远超你的想象。"
核心要点
相关推荐

微软Build 2026:自研推理模型MAI Thinking-E及AI全家桶深度解析
微软Build 2026发布首款自研推理模型MAI Thinking-E,采用1T参数MoE架构,同步推出6款垂直AI模型。本文详解MAI Thinking-E性能表现、微软AI全家桶布局,以及OpenAI服务崩溃、千问开放生态等行业动态。

Replit领域专用Agent:一键批量修复SEO和安全漏洞
深度解析Replit推出的领域专用AI Agent,包括Growth Agent自动发现SEO问题和Security Agent主动检测安全漏洞,支持全选一键批量修复,大幅提升开发效率。

APImart体验:一站式低价调用GPT、Claude等主流大模型
实测APImart API聚合中转站,支持GPT-4o、Claude、Veo等主流AI大模型统一调用。GPT图像生成低至4分钱一张,详解注册使用流程、生成效果、价格对比及注意事项。