欢迎回来,今天咱们AI工具最新评测专栏,聊点硬核的。我这周被两件事刷屏了,一个是Claude Opus 4.7的评测,一个是AI编程工具的花式续杯方案。
你说续杯我还以为你又去薅瑞幸了。
得了吧,我薅的是Cursor和Kiro的羊毛。不过说真的,这周素材里有个共同的暗线,你发现没?就是AI工具正在从单点能力竞争,转向生态和体验的竞争。
这个观察很准。我先抛个结论——二零二五年下半年,AI工具的核心战场不是谁的模型更强,而是谁能让用户用得更顺、更久、更稳。
那咱们就从编程工具开始聊。Cursor和Kiro一卡双用这个方案,坦白说我第一反应是,这也太野路子了吧。但仔细想想,它恰恰说明了一个问题。
说明用户被额度限制逼疯了对吧。Cursor每月的调用次数对重度用户来说确实不够,尤其你做大型项目重构的时候,那个额度烧得跟流水似的。
我们组有个同事就是这样,下午三点额度就见底了,剩下半天只能手写代码,他说感觉自己被打回了原始社会。
所以才有人搞出这种无感切换方案。本质上就是用插件做一个智能路由层,Cursor额度快没了,自动切到Kiro继续干活。技术上不复杂,但思路很聪明。
从产品经理角度看,这其实是用户在用脚投票。当官方的定价策略满足不了需求,社区就会自己造轮子。这对Cursor应该是个警示信号。
而且Kiro被低估了。亚马逊出品,底层模型能力不差,项目理解能力这块我自己测过,大型monorepo的上下文把握确实比半年前好了一大截。
等等,你说的这个上下文理解能力,正好可以接到Claude Opus 4.7的评测上。这次Anthropic放出来的数据挺猛的,编程提升百分之十三,视觉翻三倍。
百分之十三这个数字你别小看。九十三项编程基准测试,其中四个任务是上一代根本做不了的,这说明不是量变是质变。
我最惊讶的是那个答辩准备的测试。一句话指令,直接输出三份完整文件,白板、图表、PPT,而且数据前后完全一致。
这个叫多文档输出的全局一致性,是大模型最难做好的能力之一。你想啊,生成一份文档容易,同时生成三份还要数据互相对得上,这对模型的长上下文管理要求极高。
说人话就是,以前AI帮你写三页PPT,第一页说市场规模一百亿,第三页可能就变成八十亿了。
对,Opus 4.7基本解决了这个问题。这也是为什么我说它不是常规迭代,而是能力跃升。
但有个现实问题,国内用户用Claude越来越难了。封号力度加大,身份验证收紧,很多人被迫走中转平台。
这又回到我们开头说的那个主题了。模型再强,用不上等于零。所以现在围绕Claude生态,出现了一大批中转服务、API聚合平台,本质上都是在解决可达性问题。
可达性,这个词精准。我注意到不管是Cursor的续杯方案,还是Claude的中转服务,用户最核心的诉求就三个字——用得上。
然后才是用得好、用得久。这是一个需求金字塔。
说到这儿我想聊聊Google。这周有两篇素材都提到了Google Antigravity,一个是SDK版本,一个直接到2.0了。你怎么看这个产品?
坦白讲,目前信息太少,没法下定论。但有两个信号值得注意。第一,它是以Product类别发布的,不是实验项目。第二,直接就2.0了,说明1.0阶段已经在内部跑通了。
名字也有意思。Python里import antigravity是个彩蛋,Google拿来当正式产品名,这是在向开发者社区致敬吗?
致敬是一方面,更重要的是品牌隐喻。反重力嘛,就是让开发变得轻盈、摆脱束缚。我猜大概率是AI开发工具平台方向,跟Gemini生态打通。
如果真是这样,那就是直接跟Cursor、Kiro抢市场了。Google Cloud加Gemini模型加开发者工具,这个组合拳打下来挺吓人的。
所以你看,整个行业的竞争格局正在加速重构。Anthropic在卷模型能力,亚马逊在卷编程工具,Google在卷开发者生态,最后受益的其实是我们这些用户。
这周还有个有意思的事,科技圈有人发了条推文就四个词,It's almost time,然后整个社交媒体就炸了。
经典的悬念营销。蔡格尼克效应嘛,人脑对未完成的信息有天然的执念。不过说实话,这招在AI圈用得太多了,我现在看到这种预告基本免疫了。
你可拉倒吧,上次OpenAI放倒计时页面你不是刷了一晚上吗?
那不一样,那次是真有料。但这也提醒我们,面对这类预告要保持理性,历史上雷声大雨点小的案例太多了。
好,那我来做个本期总结。这周的AI工具评测有三个关键词。第一,可达性,用户最基本的诉求是稳定地用上好工具。
第二,能力跃升。Opus 4.7证明了大模型还远没到天花板,编程和视觉理解都还有巨大的提升空间。
第三,生态竞争。从Cursor到Kiro到Google Antigravity,AI工具的战场正在从单点功能扩展到整个开发者生态。
最后留个思考题给大家。当AI编程工具越来越强,开发者的核心竞争力到底会变成什么?是架构设计能力,还是提问的艺术?下期咱们可以接着聊。
好问题。那这期就到这儿,咱们下周AI工具评测专栏再见。