播客频道 | DeepMind联手EVE Online：为何选择这款20年老游戏做AI研究？

今天聊一个特别有意思的事儿。DeepMind，就是搞出AlphaGo的那个团队，最近宣布要跟一款运营了20多年的老游戏合作做AI研究。这款游戏叫《EVE Online》，一款太空沙盒网游。很多人第一反应可能是——啊？都2025年了，怎么还拿游戏做AI研究？而且还是一款这么老的游戏？哈哈，这个反应很正常。但其实你仔细看DeepMind的历史，游戏一直是他们最核心的试验场。而且他们选游戏是有一条非常清晰的复杂度递进线的。最早是2013年用Atari游戏训练DQN算法，AI就看屏幕像素学打游戏，那个阶段解决的是离散动作空间、完全信息的问题。然后2016年AlphaGo下围棋，围棋的状态空间是10的170次方，传统算法根本穷举不了，靠的是蒙特卡洛树搜索加深度神经网络。再到2019年AlphaStar打《星际争霸II》，那就更难了——实时决策、不完全信息、多单位协同控制，最后打到了欧服前0.15%。对，从回合制到实时制，从完全信息到不完全信息，每一步都在逼近真实世界。那按这个逻辑，《EVE Online》是比《星际争霸II》还要再上一个台阶？不是上一个台阶，是上了好几个台阶。你看，《星际争霸》再复杂，本质上还是两个人或者少数几个人在一局有限时间的比赛里对抗，规则是固定的。《EVE Online》完全不一样。它有几个特性让它成为一个全新量级的挑战。你展开说说？我知道这游戏挺硬核的，但具体硬核在哪？首先最关键的一点——单一服务器宇宙。绝大多数网游都是分服的对吧，你在一区我在二区，互不相干。但《EVE Online》所有玩家都在同一个叫'新伊甸'的宇宙里。它跑在一个叫Tranquility的超级集群上，为了处理大规模战斗时的服务器压力，CCP还专门开发了一个叫'时间膨胀'的技术——战斗太激烈的时候，游戏时间会自动减慢，确保服务器能处理所有指令。这意味着什么呢？它产生的是一个完整的、不可分割的社会经济数据集，没有数据孤岛。嗯，这个我理解。如果是分服的，每个服务器其实是一个独立的小世界，数据是割裂的。单一服务器的话，所有玩家的行为都是相互关联的，对研究涌现行为来说确实价值大得多。对，而且不只是技术架构。这个游戏的经济系统复杂到什么程度呢——CCP在2007年就聘请了冰岛大学的经济学教授当首席经济学家，这在游戏行业是史无前例的。他的团队定期发布经济报告，追踪游戏里的通货膨胀率、货币流通速度，甚至基尼系数。游戏里有完整的产业链，从矿石开采到工业制造到物流运输到市场交易，玩家甚至自己发展出了期货交易和保险服务。而且这个虚拟经济真的出现过跟现实世界一样的经济现象——通货膨胀、市场泡沫、流动性危机，全都有。等等，这听起来简直像一个微缩版的真实经济体啊。某种意义上确实是。而且还有社会政治层面——玩家自发组建联盟、建立政权、发动战争，搞间谍活动、外交谈判、市场操纵，这些全是玩家自己玩出来的，不是游戏设计师预设的。2014年有一场著名的B-R5RB之战，超过7500名玩家参与，虚拟资产损失折合现实货币大约30万美元。社会学家都对这个游戏着迷。所以本质上，《EVE Online》不只是一个游戏，它是一个由数万名真实玩家共同构建的复杂适应系统。没错，学术上叫Complex Adaptive System，CAS。核心特征就是大量异质性智能体之间的非线性交互、自组织、涌现现象。宏观层面的秩序不是谁设计的，是从微观个体的局部交互中自发产生的。传统的博弈论和优化方法处理不了这种复杂度。那具体到AI研究，这次合作可能在哪些方向上产生突破？我觉得至少三个方向。第一个是大规模多智能体强化学习，就是MARL。现在主流的方法像QMIX、MAPPO，大多在几十个智能体的规模上验证。但《EVE Online》动辄几千人的大规模战役，传统方法的联合动作空间会指数级爆炸，完全失效。这会逼着研究者开发全新的可扩展算法架构。第二个是虚拟经济建模。AI可以在这个虚拟经济体里模拟不同政策干预的效果，不用承担现实世界实验的代价和伦理风险。这对现实世界的经济学研究可能有很大启发。相当于一个天然的经济学沙盒。那第三个方向呢？第三个是最让我兴奋的——通向通用人工智能的关键一步。你看，围棋也好，《星际争霸》也好，规则是固定的、边界是明确的。但《EVE Online》不一样，游戏规则会随版本更新而改变，玩家社区会发明全新的玩法和策略，经济系统会因为大规模战争发生结构性变化。当前AI有一个很大的瓶颈叫'分布偏移'——训练环境里表现很好，换个没见过的情境就不行了。《EVE Online》这种不断被人类玩家重塑的动态世界，要求AI具备持续学习、迁移泛化和常识推理的能力，这些恰恰是当前AI最薄弱的环节。所以本质上，DeepMind是在从'规则受限的竞技场'迈向'开放式复杂社会系统'。如果能在这种环境里取得突破，应用前景就远不止游戏了——供应链优化、城市规划、金融市场分析，甚至国际关系模拟，都可能受益。对，而且对游戏行业本身也有价值。更智能的NPC、更动态的游戏世界、更精准的经济平衡，这些都可能是副产品。嗯，Hassabis自己也说了，他一直对游戏充满热情，还特别提到《EVE Online》有'令人惊叹的社区'。其实想想看，这个社区本身——几万名真实玩家二十年来持续构建的这个虚拟文明——可能才是AI研究最宝贵的资源。毕竟，你在实验室里是造不出这种东西的。确实。这也是为什么选了一款20年老游戏而不是什么新游戏。不是因为它老，恰恰是因为它活了20年，积累了足够深厚的复杂性和数据。某种意义上，《EVE Online》的玩家们花了20年时间，给DeepMind准备好了一个地球上最接近真实社会的虚拟实验场。说得好。从Atari到围棋到星际争霸再到EVE，DeepMind一直在沿着复杂度的阶梯往上爬。这次能爬到哪一步，确实值得期待。

DeepMind联手EVE Online：为何选择这款20年老游戏做AI研究？

更多播客

AI热点风向标·06月07日午间版

AI热点风向标·06月07日早间版

每日AI新鲜事·06月07日早间播报