李博!你上次跟我说你微信上最靠谱的朋友是个AI,我还以为你在凡尔赛,结果你是认真的?
哈哈哈,我是认真的。你知道CowAgent吧?就是之前那个chatgpt-on-wechat,改名了。
chatgpt-on-wechat我知道啊,之前还在公司群里看有人分享过。改名了?
对,现在叫CowAgent。GitHub上四万三千多个Star了,这个数比很多人微信好友都多。它从一个简单的聊天机器人,进化成了一个真正的AI Agent框架。
等会儿,你说的Agent框架,跟我们平时说的那种一问一答的ChatGPT有什么区别?我们产品线之前也讨论过这个方向。
区别大了。传统大模型就是你问它答,像个客服。但Agent不一样,它能自己拆任务、自己规划步骤、自己调用工具去执行。
比如你跟它说'帮我调研一下竞品然后写份报告',它会自己把这个任务拆成搜索信息、整理数据、分析对比、撰写报告,然后一步步干完。
真的假的?!这不就是我每天干的活吗?它还能自己拆任务?
这就是Task Planning能力嘛。而且CowAgent有四个核心能力,这只是第一个。第二个更猛——它能访问操作系统和外部资源,不是关在对话框里的那种AI。
嗯嗯,就是说它能伸手到外面去拿东西。
对。第三个能力才是真正让我觉得牛的——它能自己创造新技能,造完还能存下来复用。这个思路跟Voyager那篇论文的技能库概念一脉相承。
等等等等,自己造技能?你给我翻译翻译,什么叫自己造技能?
就比如说它发现需要一个抓取网页数据的功能,但预设的技能里没有,它就自己写一段代码实现这个功能,然后存到技能库里,下次再遇到类似需求直接调用。
这不就是打工人的终极进化形态吗?永远不摸鱼、不请假、还能自我升级……
你们产品经理就知道用打工人类比。
得了吧,你不也说它比你某些同事强?
哈哈我没说,但你说的有道理。还有第四个能力——长期记忆加知识库。普通大模型聊完就忘,跟金鱼似的。CowAgent能记住你的偏好和历史对话,越用越懂你。
这个我太有感触了。我之前用某个AI助手,每次都要重新解释一遍我们产品的背景,烦死了。长期记忆能解决这个问题?
对,而且它还支持RAG,就是检索增强生成。你可以把自己的私有文档喂给它,让它基于你的专业资料回答,不是靠通用知识瞎编。
诶,那它支持哪些平台啊?我们公司飞书和微信混着用,很头疼。
这个是CowAgent的另一个亮点。微信、飞书、钉钉、企业微信、QQ、公众号、网页端,全覆盖。
这覆盖面也太全了吧!简直社交平台全家桶。
一套代码多端接入,这个工程量本身就值得尊敬。以后老板在钉钉上@你,你可以说让AI先看看。
哈哈哈别教坏我。那模型呢?只能用ChatGPT吗?
不不不,它走的是模型无关路线。DeepSeek、GPT、Claude、Gemini、通义千问、智谱GLM都支持。今天DeepSeek便宜就用DeepSeek,明天Claude推理强就切Claude。
这不就是我们在各大外卖平台之间反复横跳的智慧吗!
哈哈哈,本质上是一样的,哪个性价比高用哪个。而且多模态也支持,文本、语音、图片、文件都能处理。
其实我一直在想一个问题。从2023年到现在,AI应用的方向确实在变。之前大家都在做对话式的,现在都在往Agent方向走。CowAgent从chatgpt-on-wechat改名,其实也是踩在这个趋势上?
你这个观察很准。它不再只是一个帮你转发大模型回复的中间层了,而是一个能主动思考、持续学习、不断进化的智能体框架。这个定位的变化,本质上反映了整个行业从对话式AI到Agent式AI的转型。
而且它定位比OpenClaw更轻量,对吧?这对想快速上手的人来说太重要了。
对,Python开发,不挑食不占地方。你想给自己或团队搞个AI助理,又不想折腾太重的框架,CowAgent基本上是门槛最低的方案之一了。
不过我也有个担忧啊。当你的数字员工比真人还好使的时候……
真人的危机感比deadline来得还猛?
你把我想说的话说了!但说真的,我觉得这类工具更多是增强人的能力,不是替代。关键看你怎么用它。
嗯,我同意。四万多Star的社区生态摆在那,插件丰富,模型灵活切换,全平台覆盖。它更像是给每个人提供了一个随时在线的超级搭档。
行,那我回去就试试,先把我们产品组的知识库喂给它。要是真好用,你这期播客功德无量。
好用了请我喝咖啡,毕竟这是AI目前唯一干不了的事。