今天AI圈又炸了,一晚上没看手机,早上起来消息多到我差点以为刷到了假新闻。
你这说得好像每天不炸一次就不正常似的,不过今天确实猛,模型扎堆发布。
对,我先说个大的。B站上好几个博主都在聊,Anthropic发布了Claude Opus 4.8。
这次升级我觉得最值得说的不是跑分,而是它变得更诚实了。
更诚实?这词用在模型上还挺新鲜的,具体怎么说?
简单讲就是两件事。第一,代码漏洞遗漏率降了大概四倍,以前它可能会漏掉一些问题假装没事,现在不会了。
这个对我们做产品的人来说太重要了,之前用AI review代码最怕的就是它信心满满地说没问题,结果一堆坑。
第二就是它会主动说"我不确定",这在大模型里其实挺难的,因为训练目标天然就是让它给出答案。
等等,还有个Dynamic Workflows机制?上百个子Agent并行调度,听起来也太夸张了。
对,这个才是真正的工程能力升级。你可以把整个代码库级别的迁移任务交给它,它自己拆分、并行执行。
一个代码库级别的迁移啊,以前这种活儿得一个团队干好几周。
所以说Anthropic这次的策略很清楚,不卷跑分,卷可靠性和工程实用性。价格还没变,这个很关键。
而且他们还透露了一个叫Mythos的模型?B站有个视频专门讲了这个。
对,说是Mythos 1 Preview已经在后端现身了,接近公众部署阶段。同时Opus 4.8在Google Vertex AI上也被发现了,视觉和编码能力都有大幅提升。
那OpenAI这边呢?总不能干看着吧。
当然不会,GPT-5.6已经被人发现了,据说强化了多步推理和智能体工作流。
天哪,5.5还没捂热呢,5.6就来了。
还有DeepSeek V4 Pro,直接宣布75%折扣永久化,价格不到竞品的十分之一。
这价格战打得也太狠了,DeepSeek是真敢定价。
2025年6月可能是AI史上发布最密集的月份了,各家都在疯狂出牌。
说到工具端,Twitter上Cursor官方发了一个开发者习惯报告,说是基于全球最全面的AI编程数据集。
对,覆盖了所有主流模型家族的数据。B站上也有人测了Cursor Composer 2.5,说表现已经能跟Opus和GPT 5.5掰手腕了。
Cursor最近是真的杀疯了,好几个博主都在说它是最强AI编程工具。
工具这块竞争也很激烈,还有人分享了在OpenCode里配置Claude Opus各版本的方法,用AI配置AI,挺有意思的。
用AI配置AI,这个套娃我喜欢。对了,还有个轻松点的,你看到GitHub出户外周边了吗?
看到了,以ESC键命名的系列,双关"退出"和"逃离",理念是"依然是开发者,只是换了个地方"。
这文案写得也太戳人了,我都想买一件穿着去露营。
说明硅谷现在的文化风向确实在变,从拼命卷到开始关注工作生活平衡了。
你说你什么时候也按一下ESC,出去走走?
得了吧,我现在每天追模型更新都追不过来,哪有空ESC。
最后还有个挺酷的,一个独立游戏开发者用AI辅助做游戏,五分钟就生成了过场动画,还实现了镜头防穿墙这种3A级功能。
不过他也说了,当前AI的瓶颈在于没法直接适配角色骨骼绑定和动作系统,这块一旦突破,独立开发者真的能一人成军。
一个人做3A大作,想想就激动。
离那天不远了,按现在这个迭代速度,可能就是今年下半年的事。
行,今天的新闻量确实大,各位消化消化,我们晚上见。
晚上见,记得按一下ESC出去透透气。