今天聊一个特别有意思的事儿。DeepMind,就是搞出AlphaGo的那个团队,最近宣布要跟一款运营了20多年的老游戏合作做AI研究。这款游戏叫《EVE Online》,一款太空沙盒网游。很多人第一反应可能是——啊?都2025年了,怎么还拿游戏做AI研究?而且还是一款这么老的游戏?
哈哈,这个反应很正常。但其实你仔细看DeepMind的历史,游戏一直是他们最核心的试验场。而且他们选游戏是有一条非常清晰的复杂度递进线的。最早是2013年用Atari游戏训练DQN算法,AI就看屏幕像素学打游戏,那个阶段解决的是离散动作空间、完全信息的问题。然后2016年AlphaGo下围棋,围棋的状态空间是10的170次方,传统算法根本穷举不了,靠的是蒙特卡洛树搜索加深度神经网络。再到2019年AlphaStar打《星际争霸II》,那就更难了——实时决策、不完全信息、多单位协同控制,最后打到了欧服前0.15%。
对,从回合制到实时制,从完全信息到不完全信息,每一步都在逼近真实世界。那按这个逻辑,《EVE Online》是比《星际争霸II》还要再上一个台阶?
不是上一个台阶,是上了好几个台阶。你看,《星际争霸》再复杂,本质上还是两个人或者少数几个人在一局有限时间的比赛里对抗,规则是固定的。《EVE Online》完全不一样。它有几个特性让它成为一个全新量级的挑战。
你展开说说?我知道这游戏挺硬核的,但具体硬核在哪?
首先最关键的一点——单一服务器宇宙。绝大多数网游都是分服的对吧,你在一区我在二区,互不相干。但《EVE Online》所有玩家都在同一个叫'新伊甸'的宇宙里。它跑在一个叫Tranquility的超级集群上,为了处理大规模战斗时的服务器压力,CCP还专门开发了一个叫'时间膨胀'的技术——战斗太激烈的时候,游戏时间会自动减慢,确保服务器能处理所有指令。这意味着什么呢?它产生的是一个完整的、不可分割的社会经济数据集,没有数据孤岛。
嗯,这个我理解。如果是分服的,每个服务器其实是一个独立的小世界,数据是割裂的。单一服务器的话,所有玩家的行为都是相互关联的,对研究涌现行为来说确实价值大得多。
对,而且不只是技术架构。这个游戏的经济系统复杂到什么程度呢——CCP在2007年就聘请了冰岛大学的经济学教授当首席经济学家,这在游戏行业是史无前例的。他的团队定期发布经济报告,追踪游戏里的通货膨胀率、货币流通速度,甚至基尼系数。游戏里有完整的产业链,从矿石开采到工业制造到物流运输到市场交易,玩家甚至自己发展出了期货交易和保险服务。而且这个虚拟经济真的出现过跟现实世界一样的经济现象——通货膨胀、市场泡沫、流动性危机,全都有。
等等,这听起来简直像一个微缩版的真实经济体啊。
某种意义上确实是。而且还有社会政治层面——玩家自发组建联盟、建立政权、发动战争,搞间谍活动、外交谈判、市场操纵,这些全是玩家自己玩出来的,不是游戏设计师预设的。2014年有一场著名的B-R5RB之战,超过7500名玩家参与,虚拟资产损失折合现实货币大约30万美元。社会学家都对这个游戏着迷。
所以本质上,《EVE Online》不只是一个游戏,它是一个由数万名真实玩家共同构建的复杂适应系统。
没错,学术上叫Complex Adaptive System,CAS。核心特征就是大量异质性智能体之间的非线性交互、自组织、涌现现象。宏观层面的秩序不是谁设计的,是从微观个体的局部交互中自发产生的。传统的博弈论和优化方法处理不了这种复杂度。
那具体到AI研究,这次合作可能在哪些方向上产生突破?
我觉得至少三个方向。第一个是大规模多智能体强化学习,就是MARL。现在主流的方法像QMIX、MAPPO,大多在几十个智能体的规模上验证。但《EVE Online》动辄几千人的大规模战役,传统方法的联合动作空间会指数级爆炸,完全失效。这会逼着研究者开发全新的可扩展算法架构。第二个是虚拟经济建模。AI可以在这个虚拟经济体里模拟不同政策干预的效果,不用承担现实世界实验的代价和伦理风险。这对现实世界的经济学研究可能有很大启发。
相当于一个天然的经济学沙盒。那第三个方向呢?
第三个是最让我兴奋的——通向通用人工智能的关键一步。你看,围棋也好,《星际争霸》也好,规则是固定的、边界是明确的。但《EVE Online》不一样,游戏规则会随版本更新而改变,玩家社区会发明全新的玩法和策略,经济系统会因为大规模战争发生结构性变化。当前AI有一个很大的瓶颈叫'分布偏移'——训练环境里表现很好,换个没见过的情境就不行了。《EVE Online》这种不断被人类玩家重塑的动态世界,要求AI具备持续学习、迁移泛化和常识推理的能力,这些恰恰是当前AI最薄弱的环节。
所以本质上,DeepMind是在从'规则受限的竞技场'迈向'开放式复杂社会系统'。如果能在这种环境里取得突破,应用前景就远不止游戏了——供应链优化、城市规划、金融市场分析,甚至国际关系模拟,都可能受益。
对,而且对游戏行业本身也有价值。更智能的NPC、更动态的游戏世界、更精准的经济平衡,这些都可能是副产品。
嗯,Hassabis自己也说了,他一直对游戏充满热情,还特别提到《EVE Online》有'令人惊叹的社区'。其实想想看,这个社区本身——几万名真实玩家二十年来持续构建的这个虚拟文明——可能才是AI研究最宝贵的资源。毕竟,你在实验室里是造不出这种东西的。
确实。这也是为什么选了一款20年老游戏而不是什么新游戏。不是因为它老,恰恰是因为它活了20年,积累了足够深厚的复杂性和数据。某种意义上,《EVE Online》的玩家们花了20年时间,给DeepMind准备好了一个地球上最接近真实社会的虚拟实验场。
说得好。从Atari到围棋到星际争霸再到EVE,DeepMind一直在沿着复杂度的阶梯往上爬。这次能爬到哪一步,确实值得期待。