最近我有个特别强烈的感受——AI这个领域,技术迭代的速度快得让人焦虑。你想想,前两年大家还在疯狂研究提示词工程、RAG知识库、本地部署大模型,现在呢?这些话题热度已经明显下来了。所以今天我特别想聊一个问题:到底什么样的AI技术是值得我们深入投入的,不会学完就过时?
这个问题特别好,其实答案藏在AI发展的脉络里。你把这两三年AI的演进路线捋一遍,就会发现有一条非常清晰的主线——就是Agent,智能体。更准确地说,是多Agent协作。不管表面的框架和工具怎么换,这个方向是一直在往前走的。
那我们就从头捋一下。2023年ChatGPT刚出来的时候,大家其实都挺兴奋的,但回过头看,那个阶段AI能做的事情其实很有限对吧?
对,2023年本质上就是个聊天模式。你问它问题,它给你一段文字回答,就这样。说白了它就是一个特别聪明的搜索引擎。你想用它的回答去做PPT、写报告,还得自己打开软件,手动复制粘贴、排版整理。因为那时候的大模型——不管是GPT-3.5还是GPT-4——它只会生成文本,没有能力去操作外部系统,不能访问实时数据,不能帮你操作文件。所以那个阶段,AI在整个生产力里占的比重其实非常小,干活的主体还是人。
然后到2024年就进入了Copilot模式,最典型的就是GitHub Copilot。这个阶段AI开始真正介入生产环节了。
嗯,这是一个很重要的跨越。Copilot基于OpenAI的Codex模型,在海量开源代码上训练过,能理解你当前写的代码上下文,然后给你补全建议。它以插件的形式嵌入到你的开发环境里,你写着写着代码,它就自动给你续上了。但你注意啊,它的能力边界很明确——只能处理单个文件或者局部代码片段。整个项目的架构设计、模块之间的依赖关系、调试这些事,它搞不定。所以那时候大家管它叫'副驾驶',AI大概承担三分之一的工作量,剩下三分之二还是人来做。
这个比喻很形象。那真正让我觉得画风突变的是2025年初,Agent模式来了。
对,2025年初有两件事特别有标志性。第一个是Manus的出现。这个东西厉害在哪呢?你给它一个复杂任务,比如说'帮我整理某公司第三季度的商业数据',它会自己去抓网页、筛选信息、写入Excel做分析,最后还给你出图表,全程不需要你动手。它背后其实是一套'计划-执行-监控'的架构,先把大任务拆成小步骤,然后一步步执行,每一步还会自己评估结果,不对就调整。第二个是Cursor这类AI编辑器,你只要用自然语言描述你想要什么功能,代码编写、文件生成、项目架构搭建全部AI来做。
所以到这个阶段,主客关系其实已经反转了——AI变成了主要操作者,人反而退到了三分之一的位置,主要就是定目标、给资源、定规则。
没错,这也是为什么2025年'Agent'这个词满天飞。但你知道吗,故事还没完。到2025年下半年,又往前走了一步,进入了Agentic AI模式——也就是多Agent分工协作。
这个跟单个Agent有什么本质区别?
你可以这样理解——单个Agent就像一个全能选手,什么都自己干。但Agentic AI更像一个团队。面对复杂任务,系统会把它拆成多个子任务,分配给不同的专业Agent。比如有个'项目经理Agent'负责规划,有'工程师Agent'负责执行,还有'审核Agent'负责质量检查。它们之间通过消息传递和共享上下文来协调。而且每个Agent都有一个很关键的能力——反思调整。执行一步之后会自己评估,不达标就改策略,形成一个思维循环。
这个确实更接近人类团队的工作方式了。那从技术实现上来说,多Agent协作具体怎么搭建呢?
主要有两种架构思路。第一种是Graph引擎驱动的工作流编排,比如LangGraph就是典型代表。你用有向图来定义Agent之间的协作流程,每个节点是一个Agent或处理步骤,边代表流转方向。这种方式流程可控、可审计,特别适合金融、医疗这些对合规性要求高的行业。第二种更先进,就是Agent自主代理——不预定义固定流程,Agent根据任务需求自己决定下一步干什么。
第二种听起来更灵活,但也更难实现吧?那Agent到底是怎么学会'自己思考'的?
这就要说到一个非常核心的技术——ReAct思维框架。ReAct是Reasoning加Acting的缩写,2022年普林斯顿和Google Brain联合提出的。它的精髓是一个'推理-行动-观察'的循环。Agent先分析当前状态,想清楚该做什么,这是推理;然后去调用工具或执行操作,这是行动;最后看看结果对不对,这是观察。不对就回到推理重新来。这个循环不断迭代直到任务完成。它的创新在于把思维链推理和工具调用统一到了一个闭环里,之前这两个是分开的——思考的不动手,动手的不思考。
有了思考能力,还得有'手'才行,对吧?Agent怎么去操作外部工具?
你说到点子上了。这里就要提MCP协议——Model Context Protocol,模型上下文协议。这是Anthropic在2024年底提出的。你想啊,以前每个AI应用要调用不同的工具,都得单独写集成代码,特别麻烦。MCP就相当于定了一套统一标准,AI模型是客户端,工具提供方是服务器,怎么描述工具能力、怎么调用、怎么返回结果,全都规范好了。你可以把它类比成Web领域的REST API规范。现在OpenAI、Google都已经支持了,正在成为事实标准。
所以ReAct给了Agent大脑,MCP给了Agent双手,再加上多Agent协作的组织架构,这就构成了一个完整的体系。
对,而且还有一层——专业技能系统。Agent不光要会用工具,还要有领域知识、标准操作流程、质量评估标准,这样才能像真正的专家一样工作。这也是现在Agentic AI领域最热的方向之一。
从市场数据来看,这个方向确实在爆发。我看到一个数据说75%的企业已经在部署AI Agent了?
是的,而且从2026年到2029年市场规模逐年递增,增长非常强劲。背后的驱动力是多方面的——大模型推理能力在提升,MCP这样的标准协议在普及,云计算基础设施也成熟了。企业的运营模式也在从'AI辅助人工'向'AI自主执行、人工监督'转变。'一个人拥有一整支数字员工团队',这个事情正在变成现实。
所以回到我们开头的问题——什么技术不会过时?听下来我觉得答案其实挺清晰的。具体的框架可能会换,LangChain也好、Spring AI也好,都可能被替代。但多Agent协作架构和Agent自主决策能力,这是底层逻辑,是不变的。
完全同意。你理解了ReAct思维框架、MCP协议、多Agent编排这些核心概念,不管将来用什么框架去实现,你都能很快上手。与其追每一个热点,不如把这些底层逻辑吃透。这才是面向未来最值得的技术投资。