最近OpenAI开发者大会上发布了一个叫Agent Kit的东西,我朋友圈直接炸了。一半人说Dify、n8n要完蛋了,另一半人说这就是个玩具。我自己体验了一下,说实话感受挺复杂的。今天正好请到了在AI工作流领域深耕很久的专家,咱们好好聊聊这个东西到底是什么水平。
哈哈,你说的这个朋友圈两极分化我太有共鸣了。其实这次开发者大会不只是Agent Kit,一共发了四个大东西——Sora 2的API开放了、Codex全面开放、还有一个App SDK,以及我们今天要重点聊的Agent Kit。但我觉得最有意思的其实是App SDK和Agent Kit放在一起看,你能看出OpenAI一个非常清晰的野心。
对,App SDK我也注意到了。它本质上是不是想在ChatGPT里面搞一个App Store?
没错,就是这个意思。你想想看,OpenAI现在有超过8亿用户,这个数字其实比2008年苹果推出App Store时候的用户规模还大。它想复制苹果的路径——让第三方开发者来给平台贡献价值。不过呢,这事儿它之前其实试过一次,就是GPT Store,结果嘛……大家都看到了,上线之后基本没什么水花,大量GPTs根本没人用。所以App SDK可以理解为OpenAI对GPTs策略的一次重大修正,从让普通用户自己搭,变成让专业开发者来做。
明白了。那咱们回到Agent Kit本身,你能用最直白的话说说它到底是个什么东西吗?
简单说,它就是一个可视化的工作流搭建工具。你可以通过拖拽节点的方式来定义一个AI的工作流程。它目前有三个核心模块:第一个是Agent模块,本质上就是一个OpenAI API的调用,支持Function Calling;第二个是Evaluate评估模块,用来收集用户反馈打分;第三个就是一个对话界面,用户通过对话来触发整个工作流。
等一下,Function Calling这个概念可能有些听众不太熟悉,能展开说说吗?
好,你可以这样理解。以前大模型只能跟你聊天对吧?Function Calling就是让模型不光能聊天,还能动手干活。比如你跟AI说'帮我查一下明天北京的天气',模型会识别你的意图,然后自动生成一个结构化的参数去调用天气API,把结果拿回来告诉你。在Agent Kit里,Function Calling就像是各个节点之间的胶水,让AI能根据上下文自动决定下一步该干什么。这是它跟传统那种写死规则的自动化工具最大的区别。
这么听起来还挺厉害的。那实际体验下来呢?
嗯,怎么说呢,它最大的优点就两个字——简单。真的是足够傻瓜。这一点其实戳中了现有工具的一个痛点。你用过n8n吗?
用过,说实话学习曲线确实挺陡的,文档看得我头大。
对吧!很多开发者的心态是,我与其花两天学你n8n的文档体系,不如直接用Python把事情做了。Agent Kit就完全没有这个问题,基本上点几下就能跑起来。但是——这个但是很重要——它目前的功能真的非常有限。只支持对话场景,只能处理文字,连图像生成模型都不支持,更别说视频、音频这些多模态的东西了。节点类型也很少,复杂的业务逻辑根本搞不定。而且它只能用OpenAI自家的模型,不像Dify可以接各种模型,n8n有四百多个预置集成节点。
所以网上说它要打败n8n、打败Dify那些说法……
现阶段肯定是夸大了。你在Dify上搭的那些复杂RAG工作流,在n8n上跑的那些跨平台自动化任务,搬到Agent Kit上根本没法复现。我觉得现阶段它更像是一个原型产品,或者说概念验证。
那这就有意思了。OpenAI明明知道这东西还很初级,为什么还要急着推出来?
这个问题问得好,我觉得背后有两层战略考量。第一层,OpenAI正在从一个模型公司向平台公司转型。你看现在整个行业的趋势,开源模型越来越强,Llama、Mistral这些跟闭源模型的差距在快速缩小,光靠卖API的商业模式越来越难了。所以它必须往上走,去做应用层和平台层。Anthropic搞Claude Artifacts,Google搞Vertex AI,都是同一个逻辑。Agent Kit就是OpenAI在工作流自动化赛道的一次试水。
那第二层呢?
第二层更精妙,就是数据飞轮。你注意到那个Evaluate评估模块了吗?用户跟Agent交互完可以打分,好评差评都会存下来。这些数据可以直接用来做模型微调,甚至用于RLHF训练。你想想,每个用户在使用Agent Kit的时候,其实都在免费帮OpenAI标注数据。这就像特斯拉的自动驾驶——每一辆在路上跑的特斯拉都在给它贡献训练数据。OpenAI用Agent Kit收集真实的工作流交互数据,比从外面买数据质量高多了,成本也低多了。
这个类比太妙了。所以它表面上是发布了一个产品,实际上是在布局一个数据收集的基础设施。
对,可以这么理解。而且随着任务复杂度不断提升,这些数据会越来越值钱。
那对于现在已经在用Dify、n8n、Coze的开发者来说,需要担心吗?
短期内完全不用担心。你现有的复杂工作流在Agent Kit上跑不了,这是硬伤。Agent Kit目前能吸引的主要是那些从来没接触过工作流工具的新用户,靠的就是低门槛。但长期来看,你不能忽视OpenAI那8亿用户的基础。一旦Agent Kit持续迭代,加上多模态支持、更多节点类型、第三方集成,凭借它的生态整合能力,蚕食一部分市场份额是完全可能的。
所以对现有平台来说,当务之急是什么?
灵活性、多模态、多模型兼容,这三个方向要持续构建护城河。这些恰恰是Agent Kit短期内追不上的。你看Dify的开源社区活跃度,n8n的四百多个集成节点,这些都是长期积累的壁垒。
最后帮大家总结一下。OpenAI在模型领域毫无疑问是先驱,但在产品打造上,它其实还是个新手。Agent Kit方向是对的,但距离真正颠覆现有工作流生态,还差好几个版本的迭代。对于开发者来说,保持关注,但不必急着迁移。
嗯,我补充一句。其实这次开发者大会整体给人的感觉就是,真正重磅的东西比如新模型,OpenAI等不到大会就单独发了。大会上更多展示的是未来布局和生态愿景。所以有人觉得乏善可陈也正常。但如果你把Agent Kit和App SDK放在一起看,你会发现OpenAI从模型公司变成平台公司的决心是非常坚定的。这个趋势值得所有做AI工具的团队认真对待。