Scaling Law五层演进体系解析:Physical AI如何开启下一增长曲线
Scaling Law五层演进体系解析:Physical AI如何开启下一增…
引言
过去一年多,AI行业围绕Scaling Law的讨论从未停歇。从最初黄仁勋在GTC上提出的三条技术路线,到如今已经演化出五层Scaling体系,再到Physical AI的快速崛起,整个行业正在经历一场从虚拟世界向物理世界的范式迁移。
本文基于一位从华为离职后加入大疆的AI从业者在杭州云栖小镇的分享,梳理Scaling Law的完整演进脉络,并探讨Physical AI时代的技术走向。
Scaling Law的五层演进体系
第一层:Pre-Training Scaling(预训练扩展)
预训练扩展是最经典、也是最广为人知的一条路线。核心逻辑非常直接:通过增加模型参数规模、训练数据量和计算量,让基础模型的能力持续提升。
从GPT-1到GPT-4,从LLaMA 1到LLaMA 4,从DeepSeek V1到V4,所有主流基础模型的迭代都在验证同一个规律——数据越多、模型越大、计算量越大,效果就越好。这条路线虽然简单粗暴,但至今仍是AI能力提升的基石。
第二层:Post-Training Scaling(后训练扩展)
后训练扩展在预训练基础之上,通过指令微调、RLHF、DPO、GRPO等强化学习手段,让模型进行自学习,提升特定任务的表现。代表性工作包括GPT-4的对齐训练、Claude的安全训练以及DeepSeek V3的强化学习阶段。
后训练的核心价值在于:它让模型从"能力强"变为"能力强且可控",这对产品化落地至关重要。
第三层:Test-Time Scaling(推理时扩展)
推理时扩展是近两年最具突破性的方向。传统认知中,模型推理只是简单地给出答案,但实践证明,在推理阶段投入更多计算量和时间,让模型进行更深层的思考和验证,能获得显著更好的结果。
OpenAI的O系列模型引入思维链(Chain of Thought),DeepSeek的推理模型以及多人推理等技术不断涌现,证明了"让模型想得更久"本身就是一种有效的扩展方式。
第四层:Agent Scaling(智能体扩展)
以大模型为核心,扩展周边工具调用、记忆(Memory)、规划(Planning)等能力,放大单智能体执行复杂任务的上限。代表性技术包括:
- ReAct框架
- Planning/Soft方法
- 长期记忆机制
- MCP协议
- Function Call
Agent Scaling标志着AI从被动应答走向主动执行,开启了全新的应用范式。
第五层:Multi-Agent Scaling(多智能体扩展)
当单个Agent的能力边界被突破后,多智能体协作成为新的扩展方向。通过智能体数量增加、角色分工和通信协议,完成远超单智能体能力的复杂工作。
有意思的是,Multi-Agent的爆发速度远超预期。代表性产品如Manus、OpenCore以及Agent-to-Agent协议的出现,让现在的程序员已经不是在写代码,而是在监控几十个Agent协同运作。
从Agentic AI到Physical AI的范式迁移
虚拟世界的天花板
五层Scaling体系在虚拟世界中已经构建了相当完整的技术栈。但一个核心问题浮现:五层之后,Scaling会停止发展吗?
答案是否定的。AI正在从虚拟世界的Agentic AI,快速迈向物理世界的Physical AI。虽然目前Physical AI还没有非常明确的杀手级应用,但趋势已经越来越清晰。
Physical AI时代的Scaling Law重构
Pre-Training层面:模型形态的根本转变
模型形态从LLM(大语言模型)到VLM(视觉语言模型)到VLA(视觉-语言-动作模型),正在走向WM(World Model,世界模型)。世界模型能够理解和模拟物理世界的运行规律,为无人机、自动驾驶、机器人等物理智能体提供决策基础。
Post-Training层面:模型压缩与专业化
Physical AI对后训练提出了全新要求。在垂直行业落地时,需要将大模型压缩、蒸馏、强化为更小更精的Small LLM/VLM/WM,以适应嵌入式设备的算力约束。围绕Physical AI Scaling Law进行模型的精简化和专业化,正在成为头部企业的核心攻坚方向。
Test-Time Scaling层面:从云端到端侧
在物理世界中,推理时扩展的形态发生了本质变化。可穿戴设备、AI眼镜等硬件需要实时理解周围环境,这意味着推理不再发生在云端,而是在随身的小型芯片上即时完成。AI Glasses正是这个方向最被看好的品类。
情感与记忆:Physical AI的核心差异化
当AI硬件具备了Agent能力后,长期记忆(Memory)和情感理解(Emotion)将成为关键差异化因素。AI硬件不仅要能执行任务,还要能理解用户、陪伴用户——这意味着从"工具"到"伙伴"的质变。
目前已有大量创业公司在这个方向上布局,试图打造具有情感交互能力的物理智能体。
下一条增长曲线在哪?
从目前的技术演进规律来看,每一层Scaling都是对前一层"边界"的突破:
| 层级 | 突破的边界 |
|---|---|
| Pre-Training | 模型能力的边界 |
| Post-Training | 模型可控性的边界 |
| Test-Time Scaling | 推理质量的边界 |
| Agent Scaling | 单次交互的边界 |
| Multi-Agent Scaling | 单体能力的边界 |
Physical AI正在突破数字世界的边界,让AI真正进入物理空间。而当物理世界中的AI足够密集时,物理世界的Multi-Agent协作——即大量智能硬件的自组织协同——可能就是下一个爆发点。
总结
Scaling Law远未到达尽头。它不是一条直线,而是一棵不断分叉生长的技术树。从虚拟到物理,从单体到群体,从工具到伙伴,AI的扩展之路仍然充满想象空间。
对于从业者而言,理解这五层(乃至更多层)Scaling的内在逻辑,才能准确判断下一个技术浪潮将在何处涌起。无论是选择深耕Multi-Agent协作,还是投身Physical AI的世界模型研发,关键在于看清Scaling Law演进的方向——每一次突破,都是对现有边界的跨越。
相关推荐
Hooks与Skills:AI编程工作流从手动提醒到自动化系统的升级指南
Hooks与Skills:AI编程工作流从手动提醒到自动化系统的升级指南
深入解析Claude Code的Hooks与Skills机制,教你用三层架构(Cloud.md+Hooks+Skills)构建安全可靠的AI编程工作流,实现从软约束到硬工程的关键跃迁。
Pi Coding Agent 深度配置指南:自定义工具、子代理与技能系统全解析
Pi Coding Agent 深度配置指南:自定义工具、子代理与技能系统全解析
两个月实战打磨的Pi Coding Agent完整配置分享,涵盖自定义工具扩展、子代理系统、持久化记忆、安全管理和技能系统等核心模块的详细配置方法与使用经验。
Claude Code工作原理深度解析:提示组装、权限控制与Skills机制
Claude Code工作原理深度解析:提示组装、权限控制与Skills机制
深入解析Claude Code内部工作机制,涵盖模型无状态原理、提示组装四层架构、Agentic Loop执行流程、权限控制策略及Skills可复用工作流模板,助你掌握agentic engineering核心技能。