播客频道 | AI工具最新评测·本周专题

欢迎回来，今天咱们AI工具最新评测专栏，聊点硬核的。李博你先说，这周你被什么刷屏了？ Claude Opus 4.7，毫无疑问。编程提升13%，视觉能力直接翻三倍，这数据太炸了。等等我先缓缓，你今天这件外套挺好看的，新买的？得了吧，你每次想套我话都先夸我。说正事，这周素材量很大，咱们得好好捋一捋。行行行，那我先抛个观察。这周最明显的趋势就是AI编程工具的军备竞赛全面升级了。Cursor、Kiro、Claude Opus 4.7，全凑一块了。没错。而且你注意到没有，这轮竞争已经不是比谁模型强了，是比谁的生态更能留住开发者。你这个点很有意思。我看到一个一卡双用的教程，Cursor和Kiro之间无感切换，说白了就是用户在用脚投票嘛。对，这恰恰说明现在没有哪款工具能完全满足重度用户。Cursor有调用次数限制，Kiro之前有风控问题，用户只能两头薅。从产品经理角度看，这种续杯式使用其实挺伤害平台的。用户忠诚度被稀释了。但反过来想，这也倒逼平台加速迭代。你不够好，用户分分钟切走。所以Claude Opus 4.7这时候出来，时机就很微妙。它直接把底层模型能力拉高了一个档次。我给你说个具体数据。93项编程基准测试提升13%，其中4个任务是上一代和Sonnet都做不了的，Opus 4.7直接搞定了。这意味着什么？意味着能力边界在扩展，不只是做得更好，而是能做以前做不了的事。这是质变，不是量变。我印象最深的是那个答辩准备的测试。一句话生成三份文件，数据还能前后一致，这个太实用了。长上下文的信息管理能力，这是大模型最难啃的骨头之一。数据一致性意味着模型真的在理解全局，而不是逐段生成然后拼凑。视觉能力翻三倍这个呢？你觉得实际体感如何？多模态是今年的主战场。视觉理解能力提升意味着它能看懂截图、设计稿、图表，然后直接转化成代码或分析。对产品经理来说这不是利好吗？你可拉倒吧，我还没来得及高兴呢。国内用Claude动不动就封号，这才是真正的痛点。所以你看那篇文章专门讲了中转平台方案。说实话，这种生态本身就说明需求有多旺盛。好，咱们聊聊另一个大新闻。Google发布了Antigravity SDK，还直接出了2.0版本。这个事情很有趣。两篇文章分别讲了SDK和2.0，但信息都很模糊。我的判断是，这大概率是个AI开发工具平台。为什么这么确定？你看命名逻辑。Python的antigravity彩蛋核心隐喻是让编程变得毫不费力。Google用这个名字，就是在说我要让AI开发像反重力一样轻松。而且直接标注为Product类别，不是实验项目。Google这次是认真要抢开发者生态了。这就跟我们前面聊的形成闭环了。Cursor、Kiro在抢个人开发者，Google直接从平台级切入，降维打击。再加上那条神秘推文，说时候快到了。整个行业都在蓄势待发的感觉。悬念营销嘛，蔡格尼克效应。但我觉得这条推文背后大概率是某个新模型或者重大产品更新。你赌哪家？不赌，但如果非要猜，OpenAI最近太安静了，反而可疑。好，我来总结一下这期的核心观察。第一，AI编程工具的竞争已经从模型能力延伸到了生态粘性。第二，Claude Opus 4.7证明了底层模型的能力边界还在快速扩展，编程和视觉都有质的突破。第三，Google用Antigravity SDK切入开发者工具赛道，平台级玩家入场会重塑竞争格局。留个思考题给听众吧。当AI编程工具越来越强，开发者的核心竞争力到底会变成什么？是架构设计、产品思维，还是别的什么？这个问题值得每个人想想。下期AI工具评测专栏见，我们不见不散。

AI工具最新评测·本周专题

更多播客

AI热点风向标·06月07日午间版

AI热点风向标·06月07日早间版

每日AI新鲜事·06月07日早间播报