最近OpenAI第二次开发者大会刚结束,朋友圈就被刷屏了。尤其是Agent Kit这个东西,好多人说它要把Dify、n8n、Coze这些公司全干掉。我看完之后第一反应是——真有这么猛吗?今天请来了我们的老朋友,一起聊聊这个话题。"},
{"speaker": "guest", "text": "哈哈,我看到那些标题的时候也笑了。什么"初创公司瑟瑟发抖"之类的,说实话,我觉得大家可能有点过度解读了。"},
{"speaker": "host", "text": "那我们先快速过一下这次开发者大会的几个更新吧。除了Agent Kit,其实还有三个东西——Solar2 API开放、Codex全面开放,还有一个App SDK。"},
{"speaker": "guest", "text": "对,其实Codex全面开放这个事挺值得说的。之前它只对部分Pro和Team用户开放,现在所有开发者都能用了。你可以把Codex理解成一个远程同事,不是像GitHub Copilot那样在你旁边帮你一行一行写代码,而是你把一个任务扔给它,它自己去读代码库、写代码、跑测试,最后给你提一个Pull Request。这个对开发效率的提升其实挺大的。"},
{"speaker": "host", "text": "嗯,还有App SDK,我觉得这个也挺有意思的。它本质上是GPTs的升级版对吧?"},
{"speaker": "guest", "text": "没错。你还记得GPTs吗?2023年推出来的时候大家也很兴奋,结果后来发现两个问题:开发者在里面做不了太复杂的东西,GPT Store的流量分发也不行。App SDK就是想解决这些问题,让开发者能在ChatGPT里面嵌入自定义的界面组件、处理支付、管理用户状态。你可以把它想象成ChatGPT要变成一个类似微信小程序的平台。"},
{"speaker": "host", "text": "好,那我们重点来聊Agent Kit。从界面上看,它就是一个可视化的工作流编辑器,拖拖拽拽连连线,跟Dify、n8n长得很像。"},
{"speaker": "guest", "text": "对,这种东西在技术上叫有向无环图,也就是DAG。每个节点是一个处理单元,比如调用API、做条件判断、转换数据,节点之间的连线定义数据怎么流、先后执行什么。这种模式其实不新鲜,Apache Airflow那些工具早就在用了。到了AI时代,节点里多了大模型推理、向量检索这些操作,但本质是一样的。"},
{"speaker": "host", "text": "那我实际体验下来发现一个挺有意思的事——Agent Kit目前的核心处理模块,其实就是一个OpenAI的API调用。它支持工具调用和一些配置,但连图像生成模型都不支持。"},
{"speaker": "guest", "text": "你看,这就很说明问题了。而且我要补充一点,它构建完工作流之后,点Preview进去的是一个对话界面。也就是说,整个Agent Kit目前只针对对话场景,只支持文字相关的工作流。这个限制其实挺大的。"},
{"speaker": "host", "text": "那如果要说它有什么优点的话呢?"},
{"speaker": "guest", "text": "简单。就一个词。用过n8n的人应该深有体会,那个学习曲线真的很陡,海量的文档、复杂的配置,好多开发者宁愿自己用Python写也不想啃n8n的文档。Agent Kit因为刚出来,功能就那么几个,配置项也不多,上手确实快。"},
{"speaker": "host", "text": "但这就引出一个很关键的问题了——这种简单,到底是刻意的产品设计,还是因为它本来就没做完?"},
{"speaker": "guest", "text": "哈哈,这个问题问得好。说实话,目前真的判断不了。它的简单既是最大的卖点,也是最大的限制。从工作流灵活性来看,Agent Kit并没有什么过人之处。"},
{"speaker": "host", "text": "所以回到最开始的问题——网上说它要取代Dify、n8n这些产品,你怎么看?"},
{"speaker": "guest", "text": "明显言过其实了。你想啊,首先它只支持对话场景和文字工作流,图像、多模态这些复杂需求根本覆盖不了。其次,一旦工作流变复杂,它就处理不了了。还有一个很现实的问题——已经在用Dify或n8n的用户,他们现有的那些工作流大概率在Agent Kit上复现不了,谁会愿意迁移?说它是原型阶段都算客气的,有些人直接说是玩具阶段。"},
{"speaker": "host", "text": "那问题来了,既然产品这么初级,OpenAI为什么还要在开发者大会上推它?"},
{"speaker": "guest", "text": "这就要看战略层面了。我觉得有两层意图。第一层,OpenAI不想只做一家模型公司了,它想变成一个平台公司。你看科技行业经典的路径就是从基础设施到平台再到生态,AWS当年也是这么走的,苹果也是从硬件厂商变成了App Store生态的运营者。"},
{"speaker": "host", "text": "对,而且纯做模型API确实有风险。Meta的Llama、Google的Gemini、Anthropic的Claude都在追赶,模型能力越来越商品化,光靠API调用很难维持高溢价。"},
{"speaker": "guest", "text": "没错,而且如果开发者只是调你的API,切换到竞品的成本太低了。通过Agent Kit、App SDK这些平台工具,OpenAI其实是在增加开发者的迁移成本,把一次性的API调用关系变成深度的平台依赖。这是第一层。"},
{"speaker": "host", "text": "第二层呢?"},
{"speaker": "guest", "text": "第二层更巧妙——数据飞轮。Agent Kit里有一个Evaluate模块,看起来就是一个简单的点赞点踩功能,但它背后对应的是RLHF,就是基于人类反馈的强化学习。传统的RLHF数据采集成本极高,需要专业标注团队。但通过Agent Kit内嵌的评价系统,OpenAI可以在真实业务场景中大规模、低成本地收集用户偏好数据。用户用Agent、给反馈、模型变好、体验提升、更多人来用——这就是一个正向飞轮。"},
{"speaker": "host", "text": "这么一说确实很聪明。与其花大价钱从外面买数据,不如自己建工具让数据自然流进来。"},
{"speaker": "guest", "text": "对,所以从各个方面来看,Agent Kit的推出更多是一种战略布局,而不是当下要跟谁打产品仗。"},
{"speaker": "host", "text": "最后聊聊这次开发者大会的整体感受吧。我个人觉得跟第一次比,这次有点乏善可陈。"},
{"speaker": "guest", "text": "其实原因也好理解。现在竞争这么激烈,真正重磅的消息——比如新模型发布——不可能等到开发者大会才说,早就作为单独新闻提前放出去了。开发者大会上展示的更多是未来布局和生态愿景,就是告诉大家"来跟我一起建生态吧"。"},
{"speaker": "host", "text": "嗯,这其实也说明了一个事实——OpenAI在模型层面毫无疑问是领头羊,但在产品层面,还有很长的路要走。模型强不等于产品强,中间还差着对用户需求的理解和产品细节的打磨。"},
{"speaker": "guest", "text": "完全同意。所以对于开发者来说,如果你只是想快速搭一个简单的对话型Agent,Agent Kit的低门槛确实有吸引力。但如果你需要复杂的自动化工作流,Dify、n8n这些成熟工具目前还是更好的选择。至于Agent Kit未来能不能真正威胁到这些公司,就看OpenAI能不能在保持简洁的同时大幅提升灵活性了——而这恰恰是产品设计里最难的平衡。"},
{"speaker": "host", "text": "说得好。简洁和强大之间的平衡,确实是所有产品经理的终极难题。好了,今天关于Agent Kit就聊到这儿,大家可以自己去体验一下,形成自己的判断。"}
],