播客频道 | 每日AI新鲜事·05月29日早间播报

今天AI圈又炸了，一晚上没看手机，早上起来消息多到我差点以为刷到了假新闻。你这说得好像每天不炸一次就不正常似的，不过今天确实猛，模型扎堆发布。对，我先说个大的。B站上好几个博主都在聊，Anthropic发布了Claude Opus 4.8。这次升级我觉得最值得说的不是跑分，而是它变得更诚实了。更诚实？这词用在模型上还挺新鲜的，具体怎么说？简单讲就是两件事。第一，代码漏洞遗漏率降了大概四倍，以前它可能会漏掉一些问题假装没事，现在不会了。这个对我们做产品的人来说太重要了，之前用AI review代码最怕的就是它信心满满地说没问题，结果一堆坑。第二就是它会主动说"我不确定"，这在大模型里其实挺难的，因为训练目标天然就是让它给出答案。等等，还有个Dynamic Workflows机制？上百个子Agent并行调度，听起来也太夸张了。对，这个才是真正的工程能力升级。你可以把整个代码库级别的迁移任务交给它，它自己拆分、并行执行。一个代码库级别的迁移啊，以前这种活儿得一个团队干好几周。所以说Anthropic这次的策略很清楚，不卷跑分，卷可靠性和工程实用性。价格还没变，这个很关键。而且他们还透露了一个叫Mythos的模型？B站有个视频专门讲了这个。对，说是Mythos 1 Preview已经在后端现身了，接近公众部署阶段。同时Opus 4.8在Google Vertex AI上也被发现了，视觉和编码能力都有大幅提升。那OpenAI这边呢？总不能干看着吧。当然不会，GPT-5.6已经被人发现了，据说强化了多步推理和智能体工作流。天哪，5.5还没捂热呢，5.6就来了。还有DeepSeek V4 Pro，直接宣布75%折扣永久化，价格不到竞品的十分之一。这价格战打得也太狠了，DeepSeek是真敢定价。 2025年6月可能是AI史上发布最密集的月份了，各家都在疯狂出牌。说到工具端，Twitter上Cursor官方发了一个开发者习惯报告，说是基于全球最全面的AI编程数据集。对，覆盖了所有主流模型家族的数据。B站上也有人测了Cursor Composer 2.5，说表现已经能跟Opus和GPT 5.5掰手腕了。 Cursor最近是真的杀疯了，好几个博主都在说它是最强AI编程工具。工具这块竞争也很激烈，还有人分享了在OpenCode里配置Claude Opus各版本的方法，用AI配置AI，挺有意思的。用AI配置AI，这个套娃我喜欢。对了，还有个轻松点的，你看到GitHub出户外周边了吗？看到了，以ESC键命名的系列，双关"退出"和"逃离"，理念是"依然是开发者，只是换了个地方"。这文案写得也太戳人了，我都想买一件穿着去露营。说明硅谷现在的文化风向确实在变，从拼命卷到开始关注工作生活平衡了。你说你什么时候也按一下ESC，出去走走？得了吧，我现在每天追模型更新都追不过来，哪有空ESC。最后还有个挺酷的，一个独立游戏开发者用AI辅助做游戏，五分钟就生成了过场动画，还实现了镜头防穿墙这种3A级功能。不过他也说了，当前AI的瓶颈在于没法直接适配角色骨骼绑定和动作系统，这块一旦突破，独立开发者真的能一人成军。一个人做3A大作，想想就激动。离那天不远了，按现在这个迭代速度，可能就是今年下半年的事。行，今天的新闻量确实大，各位消化消化，我们晚上见。晚上见，记得按一下ESC出去透透气。

每日AI新鲜事·05月29日早间播报

更多播客

AI热点风向标·06月07日午间版

AI热点风向标·06月07日早间版

每日AI新鲜事·06月07日早间播报