Cursor重磅更新:Composer 2模型+Glass界面深度体验

Cursor发布Composer 2模型与Glass界面,大幅提升AI编程速度与交互体验。
Cursor发布重大更新,包含Composer 2代码生成模型和全新Glass界面。Composer 2提供标准版和Fast版,Fast版推理速度极快,在Terminal Bench 2.0基准测试中得分61.7%,定位"够快够好"。Glass界面引入"先规划后执行"的智能确认机制,支持Agent会话、插件市场和多模式切换,能通过一条指令生成完整Web应用。
Cursor Glass + Composer 2 深度解析
Cursor 刚刚发布了一次份量十足的更新——全新的 Composer 2 模型和名为 Cursor Glass 的界面。这次更新不只是常规迭代,而是在代码生成速度、AI代理交互方式、开发流程整合三个方向上同时发力。下面从模型性能、界面设计、实际开发体验几个角度,拆解这次更新到底带来了什么。
Composer 2模型:推理速度与代码质量的平衡
标准版与Fast版怎么选
Cursor 为 Composer 2 提供了标准版和 Fast 版两个选项。这个策略和 GPT 5.4 Fast、OpenAI 4.6 Fast 的思路一样——同一个模型底座,但 Fast 版提供加速推理,费用大约是标准版的三倍。
实测下来,Composer 2 Fast 的输出速度比 GPT 4 Fast 和 OpenAI 4.6 Fast 都快。代码生成过程中,Token 吐出的速度快到你根本来不及逐行阅读。对于日常开发来说,这种"秒出结果"的体验确实能明显减少等待焦虑。
Terminal Bench 2.0基准测试成绩
在开发者关注度很高的 Terminal Bench 2.0 基准测试中,Composer 2 拿到了 61.7% 的得分。作为参考,OpenAI 4.6 是 58%,GPT 5.4 是 75.1%。
关于 Terminal Bench 2.0:这是专门针对AI代码代理(Coding Agent)在真实终端环境中执行任务能力的基准测试框架。与传统的代码补全基准(如HumanEval、MBPP)不同,它模拟的是开发者在命令行环境中完成端到端任务的全流程——包括文件操作、依赖安装、调试修复、测试运行等。这类测试更贴近实际开发场景,因为它考察的不只是模型能否写出正确代码,而是能否在复杂、有状态的环境中自主完成任务。61.7%的得分意味着在近62%的测试任务中,模型能够从头到尾独立完成,这对于日常开发中的自动化任务具有重要参考价值。
单看分数,Composer 2 并不是最强的。但换个角度想:日常写代码时,你真的每次都需要最顶尖的模型吗?多数场景下,工具响应够快、能准确定位代码库中的信息、遵循现有代码规范,这些实用价值往往比跑分更重要。Composer 2 的定位正是"够快够好",而不是"最强但慢"。

Cursor Glass界面:AI编程交互的全新范式
类似Codex桌面端的操作体验
Cursor Glass 用起来和 OpenAI Codex 桌面应用有几分相似,但融入了 Cursor 自己的设计思路。在这个新界面里,你可以做这些事:
- 启动新Agent会话:下达指令即可开启一个独立的AI代理
- 插件市场:类似 Codex 技能和 Claude 插件的机制,支持下载各类开发工具扩展
- 对话记录管理:按项目维度查看历史对话,方便回溯
- 快捷键切换模式:按
Shift+Tab切换到类似 Claude Code 的终端模式;连按两次进入计划模式
先规划再动手:智能确认机制
这是 Glass 体验中最让人眼前一亮的设计。当你发出开发指令后,模型不会立刻开始写代码,而是先做一轮整体规划,然后通过结构化界面向你确认关键细节。

举个例子,当你说"帮我创建一个博客"时,模型会主动追问:
- 文章用 MDX 存储还是接入无头 CMS?
- 需要哪些功能模块?首页、文章列表、RSS 订阅?
- 要不要加全文搜索?
关于这两种内容方案:MDX 是 Markdown 与 JSX 的结合体,允许在文档中直接嵌入 React 组件,适合内容与代码高度融合的技术博客,Next.js、Astro 等框架均原生支持。而无头 CMS(Headless CMS)则将内容管理后台与前端展示层完全解耦,通过 REST 或 GraphQL API 提供数据,Contentful、Sanity、Strapi 是主流选择,更适合需要非技术人员参与内容管理的团队协作场景。AI 在规划阶段主动询问这一选择,体现了其对现代 Web 架构决策的深度理解——这一决策直接影响后续的技术栈、部署方案和协作方式。
确认之后,右侧面板会展示完整的执行计划:用 Markdown 渲染的任务说明、技术栈对比表格,甚至还有 Mermaid 图表来展示整体架构。
关于 Mermaid:这是一种基于 JavaScript 的轻量级图表描述语言,允许开发者用类似 Markdown 的纯文本语法生成流程图、时序图、架构图等多种可视化图表。它已被 GitHub、Notion、GitLab 等主流开发平台原生支持,成为技术文档领域的事实标准之一。在 AI 编程工具中集成 Mermaid 渲染,意味着模型不仅能用文字描述架构,还能直接输出可视化的系统设计图,大幅降低开发者理解复杂系统结构的认知负担。
另外还附带一份待办清单,让你对整个开发流程心中有数。
这种"先规划后执行"的模式和 Plot Code 广受好评的 Plan 功能思路一致。核心逻辑很简单:在规划环节多花两分钟把需求理清楚,后续 Composer 2 几乎能一次性把整套方案执行到位。
实战演示:一条指令构建完整Web应用
博客应用生成与风格定制
在实际演示中,从一个空目录开始,仅用一条指令就生成了一个完整的博客应用——包含文章列表页、单篇文章详情页,以及代码块、引用等各种 Markdown 语法的渲染支持。
更有意思的是风格定制能力。当要求把主页改成"新野兽派风格的 SaaS 落地页"时,模型实时构建各个 UI 组件,最终生成的页面配色大胆、视觉层次丰富。
关于新野兽派(Neo-Brutalism):这是近年在 SaaS 产品和独立开发者社区中兴起的 UI 设计风格,脱胎于 1950-70 年代的建筑野兽主义(Brutalism)美学。其核心特征包括:高饱和度的大色块、粗黑边框、明显的阴影偏移、无圆角或极小圆角的元素,以及刻意打破传统"精致感
相关推荐
科技前沿GitHub Agent HQ发布:AI编程工具进入平台化竞争时代
GitHub Universe大会发布Agent HQ平台,统一管理编码Agent,Copilot升级支持多模型集成。同期OpenAI完成重组,Anthropic新模型测试,NVIDIA开源系列AI模型,AI编程工具格局加速整合。
科技前沿Gemini 3.5 Flash在GDPval基准上实现巨大飞跃
Google Gemini 3.5 Flash在GDPval基准测试中超越Gemini 3.1 Pro,轻量级Flash模型借助后训练技术逼近前沿水平,重新定义性能与成本的平衡点,为AI应用开发者带来重大利好。
科技前沿Google Gemini Antigravity周配额三倍提升,AI编程不再受限
Google Gemini团队再次将Antigravity周配额提升至三倍,继日配额提升后再次加码。本文解析此次配额调整对开发者的实际影响,以及在AI编程助手竞争格局中的战略意义。