今天AI圈又炸了,尤其是Claude Code相关的消息,我刷B站刷到手酸。
你不说我还想问呢,你今天是不是又穿那件格子衬衫去公司了?朋友圈看到你工位照了。
别转移话题!那是我的战袍好吗。说正事,Claude Code最近更新了个Workflow功能,你看了没?
看了看了,这个我得先抛个结论——这可能是目前Agent编排方案里最务实的一个。
B站上有个教程说,通过ultrawork关键词触发,能召唤一堆Agent协同工作。
核心理念其实挺巧妙的。它把多Agent编排从自然语言描述,转化成了JavaScript脚本。
等等,这跟之前的SubAgents有什么区别?我记得之前也能派生子Agent啊。
区别大了。SubAgents是临时派生的,用完就散,像临时工。Workflow是代码显式声明阶段和执行顺序的。
哦,就是说可复跑、可分享,确定性更强?
对,这个确实厉害。你想想,之前用自然语言编排Agent,每次跑结果可能都不一样,debug噩梦。
作为产品经理我太理解了,老板说要可复现,你给他一个每次跑都不一样的东西,那不得疯。
所以Workflow本质上是在灵活性和确定性之间找了个平衡点,用JS脚本做骨架,Agent做肉。
说到Claude Code的玩法,还有一条也很有意思——有人把它改造成测试用例生成智能体了。
这个我也刷到了,通过自定义Skills体系,从需求文档直接全量输出测试用例,五步走。
最吸引我的是它能理解流程图里隐藏的测试场景,多模态嘛,文字图片一起看。
这才是多模态模型该干的事。以前测试同学看流程图提case,总有遗漏,模型反而能穷举。
我们组测试同学要是听到这个,不知道该高兴还是该慌。
得了吧,工具替代的是重复劳动,测试策略和场景设计还是得人来。
行,聊聊Google那边。Twitter上看到Gemini Omni正式发布了,社区一周内就涌现了大量应用。
端到端原生多模态架构,文本图像音频视频全都原生支持,不是拼接的。
但另一条B站视频实测Gemini 3.1 Pro编程,结果好像不太行?
Benchmark和实战的经典老问题。实测里跨项目认证迁移那道题,五轮对话才勉强搞定。
还有Prompt理解错误和实体混淆,这在复杂上下文里确实是硬伤。
所以我一直说,别光看排行榜,真拿到手里写项目才知道谁好用。
对,这就是产品思维和技术思维的差异——用户不管你跑分多少,能不能帮我干活才重要。
说得好,给你加鸡腿。
还有几条快速过一下。有人做了Claude Code接Figma MCP的方案,AI直接生成网页同步到Figma,双向编辑。
设计开发一体化,前端切图仔的活又少了一块。不过说实话,精细度还得看实际效果。
还有个特别治愈的——有UP主做了个火锅计时小程序叫「已经熟了」,语音报菜自动生成火候卡片。
这个创意我喜欢,平静技术理念,让你放下手机好好吃火锅。
他还说人生容错率比想象中大,就像毛肚多涮两秒也不会怎样。
你可拉倒吧,毛肚多涮两秒口感差很多的好吗。不过道理是对的。
行吧行吧,今天信息量够大了。Claude Code生态真是越来越丰富,Workflow、Skills、MCP全串起来了。
Anthropic这波打法很清晰,不卷模型参数,卷开发者工具链生态。值得持续关注。
好,今天就聊到这儿,各位明天见!
明天见,记得吃火锅别焦虑。