最近跟做企业数字化的朋友聊天,他说了一句话让我印象特别深——他说现在的AI不是在帮他回答问题,而是在帮他干活。这个感受其实特别准确,因为2026年整个AI行业正在经历一个非常深刻的转变,就是从我们熟悉的生成式AI,走向所谓的代理式AI,英文叫Agentic AI。今天我们就来好好聊聊这个话题。
对,这个转变确实是今年最核心的主题。你可以这么理解,以前的AI像一个特别博学的顾问,你问它什么它都能答,但它不会主动帮你做事。而现在的Agentic AI更像一个能干的助理——你跟它说「帮我把下个季度的市场分析报告做了」,它会自己拆解任务,去查数据、调用各种工具、写初稿、甚至自己检查修改,整个流程它自己跑完。
这个类比特别好理解。那从技术上来说,它是怎么做到这一点的?
其实核心就是三层能力的成熟。第一层是规划能力,模型能把一个复杂任务拆成一步步的子任务,这背后靠的是思维链、思维树这些推理技术。第二层是工具调用,AI可以操作API、数据库、浏览器,甚至直接控制你的电脑。第三层是记忆,不光有短期的上下文记忆,还有长期记忆,能跨会话记住之前的工作状态。这三层一组合,AI就从一个「统计模式匹配器」变成了一个「目标导向的执行者」。
嗯,说到具体的产品,我注意到几个大厂的动作都很有意思。OpenAI的GPT-5.5系列直接把代理能力作为默认配置了,Anthropic那边更有趣,搞了一个叫Dreaming的功能?
Dreaming这个功能我觉得特别有想象力。你知道人睡觉的时候,大脑其实在做一件很重要的事——把白天的经历重新整理,把短期记忆变成长期记忆,还会从中提取规律。Claude的Dreaming机制就是借鉴了这个原理。它会在不工作的时候,回顾之前跟用户的所有交互,自动做摘要、识别模式、提炼经验,形成一个可复用的经验图谱。
等等,这跟我们之前常说的RAG检索增强生成有什么区别?
区别很大。RAG是被动的——你有一堆文档,AI去里面搜索相关内容。而Dreaming是主动的,它是从交互历史中自己提炼洞察。打个比方,RAG像是你去图书馆查资料,而Dreaming像是你晚上躺床上复盘今天的工作,突然想通了一些事情。这是从记忆检索到经验学习的质变。
这么说的话,AI真的在某种程度上开始「成长」了。那市场层面呢?这个赛道现在有多火?
数据很说明问题——Agentic AI市场预计年复合增长率超过40%,已经进入爆发式增长。短期来看,多代理编排加工具集成加长记忆这个组合,在企业工作流、软件开发、客服这些场景已经开始产生实实在在的回报了。
好,代理式AI这块我们聊清楚了。另一个我特别想聊的是模型迭代的速度,感觉今年各家都在拼命更新。
对,而且今年有一个很明显的特征,就是效率和规模双线并进。比如Google的Gemini 3.1 Flash-Light,用了推测解码技术实现了三倍速度提升。这个技术特别巧妙——传统的大模型生成文字是一个字一个字往外蹦的,很慢。推测解码的思路是先用一个小模型快速「猜」出一串候选文字,然后让大模型并行验证。因为验证比生成快得多,而且大部分猜测都是对的,整体速度就上去了,但输出质量完全不变。
这有点像考试的时候,先快速把答案都写上,再统一检查一遍,比一道题一道题慢慢做要快得多。
哈哈对,这个类比很到位。另外中国这边也很值得关注,DeepSeek V4在超长上下文和成本效率上持续突破。它的秘密武器是MoE架构——混合专家模型。简单说就是一个模型里有很多「专家」,但每次处理问题只激活最相关的几个。比如一个万亿参数的模型,实际推理时可能只用十分之一的参数,既保持了大模型的能力,又大幅降低了计算成本。
这就解释了为什么DeepSeek能在算力受限的情况下逼近前沿性能。说到这个,超长上下文窗口现在也是一个大趋势,百万Token已经是标配了,甚至有人在预览1200万Token?
是的,这个突破的意义非常大。传统Transformer的注意力机制计算量跟上下文长度的平方成正比,长度翻倍计算量就翻四倍,所以以前处理长文本特别贵。现在通过线性注意力、稀疏注意力这些新方法,把复杂度降下来了。实际意义是什么呢?AI可以一次性读完一整个企业代码仓库,或者一整套法律文件,不用再切片分段处理,避免了信息碎片化导致的理解偏差。
还有一个方向我觉得特别让人兴奋,就是Physical AI——AI开始走进物理世界了。
嗯,这块今年确实有实质性进展。NVIDIA的Isaac GR-00T、Cosmos世界模型这些都发布了正式版本,机器人真的开始从实验室走向工厂和仓库了。这背后有一个关键范式叫Sim-to-Real Transfer——先在虚拟世界训练,再迁移到真实世界。世界模型学会了重力、碰撞这些物理规律,可以生成逼真的模拟环境,机器人在里面做几百万次试错,不用担心摔坏或者伤人,训练好了再放到真实场景里。
这确实从根本上改变了机器人的开发方式。不过说到这些能力的提升,有一个数据让我印象很深——推理计算预计会占到AI总算力的三分之二。
对,这个数据特别关键。很多人以为训练模型最烧钱,但其实模型训练是一次性的,而推理是持续的。每个用户每次提问、每个AI代理每次执行任务,都在消耗推理算力。随着Agentic AI的普及,一个任务可能需要多步推理,算力需求是指数级增长的。所以推理效率优化现在是整个行业最核心的技术方向之一。
最后我们聊聊全球格局和风险。现在中美AI竞争的态势怎么看?
格局很清晰——美国主导顶级实验室和基础设施,中国以DeepSeek为代表走开源和高性价比路线,形成差异化竞争。有论文指出美国在前沿AI上的领先窗口可能只有12到24个月,因为中国通过架构创新在有限算力下逼近前沿的速度很快,加上华为昇腾这样的替代芯片供应链在成熟。所以这不光是技术竞争,更是产业政策和供应链的博弈。
嗯,还有一个风险我觉得容易被忽视——人类能力萎缩的问题。
这个确实值得警惕。当AI代理承担越来越多的认知任务,人类可能逐渐丧失独立完成这些任务的能力。就像GPS普及之后,很多人方向感明显退化了。在医疗诊断、工程设计这些需要深度专业判断的领域,如果从业者过度依赖AI,长期来看是有隐患的。
所以总结一下,2026年AI行业正处在从生成式到代理式再到具身式的范式转变中。代理式AI在爆发,推理效率在优化,Physical AI在落地,同时安全治理和人类自身能力的保持也是我们必须认真面对的课题。接下来Google I/O 2026马上要开了,Google在代理能力和Android AI上会放什么大招,可能会进一步定义这个行业的方向。我们持续关注。