播客频道 | 每日AI新鲜事·05月25日晚间播报

今天AI圈又炸了，尤其是Claude Code相关的消息，我刷B站刷到手酸。你不说我还想问呢，你今天是不是又穿那件格子衬衫去公司了？朋友圈看到你工位照了。别转移话题！那是我的战袍好吗。说正事，Claude Code最近更新了个Workflow功能，你看了没？看了看了，这个我得先抛个结论——这可能是目前Agent编排方案里最务实的一个。 B站上有个教程说，通过ultrawork关键词触发，能召唤一堆Agent协同工作。核心理念其实挺巧妙的。它把多Agent编排从自然语言描述，转化成了JavaScript脚本。等等，这跟之前的SubAgents有什么区别？我记得之前也能派生子Agent啊。区别大了。SubAgents是临时派生的，用完就散，像临时工。Workflow是代码显式声明阶段和执行顺序的。哦，就是说可复跑、可分享，确定性更强？对，这个确实厉害。你想想，之前用自然语言编排Agent，每次跑结果可能都不一样，debug噩梦。作为产品经理我太理解了，老板说要可复现，你给他一个每次跑都不一样的东西，那不得疯。所以Workflow本质上是在灵活性和确定性之间找了个平衡点，用JS脚本做骨架，Agent做肉。说到Claude Code的玩法，还有一条也很有意思——有人把它改造成测试用例生成智能体了。这个我也刷到了，通过自定义Skills体系，从需求文档直接全量输出测试用例，五步走。最吸引我的是它能理解流程图里隐藏的测试场景，多模态嘛，文字图片一起看。这才是多模态模型该干的事。以前测试同学看流程图提case，总有遗漏，模型反而能穷举。我们组测试同学要是听到这个，不知道该高兴还是该慌。得了吧，工具替代的是重复劳动，测试策略和场景设计还是得人来。行，聊聊Google那边。Twitter上看到Gemini Omni正式发布了，社区一周内就涌现了大量应用。端到端原生多模态架构，文本图像音频视频全都原生支持，不是拼接的。但另一条B站视频实测Gemini 3.1 Pro编程，结果好像不太行？ Benchmark和实战的经典老问题。实测里跨项目认证迁移那道题，五轮对话才勉强搞定。还有Prompt理解错误和实体混淆，这在复杂上下文里确实是硬伤。所以我一直说，别光看排行榜，真拿到手里写项目才知道谁好用。对，这就是产品思维和技术思维的差异——用户不管你跑分多少，能不能帮我干活才重要。说得好，给你加鸡腿。还有几条快速过一下。有人做了Claude Code接Figma MCP的方案，AI直接生成网页同步到Figma，双向编辑。设计开发一体化，前端切图仔的活又少了一块。不过说实话，精细度还得看实际效果。还有个特别治愈的——有UP主做了个火锅计时小程序叫「已经熟了」，语音报菜自动生成火候卡片。这个创意我喜欢，平静技术理念，让你放下手机好好吃火锅。他还说人生容错率比想象中大，就像毛肚多涮两秒也不会怎样。你可拉倒吧，毛肚多涮两秒口感差很多的好吗。不过道理是对的。行吧行吧，今天信息量够大了。Claude Code生态真是越来越丰富，Workflow、Skills、MCP全串起来了。 Anthropic这波打法很清晰，不卷模型参数，卷开发者工具链生态。值得持续关注。好，今天就聊到这儿，各位明天见！明天见，记得吃火锅别焦虑。

每日AI新鲜事·05月25日晚间播报

更多播客

AI热点风向标·06月07日午间版

AI热点风向标·06月07日早间版

每日AI新鲜事·06月07日早间播报