播客频道 | AlphaGo十周年：哈萨比斯重返韩国与李世石重逢，AI如何改变围棋

十年前有一场比赛，让全世界都屏住了呼吸——AlphaGo对战李世石。最近啊，DeepMind的创始人哈萨比斯重返韩国，跟李世石重逢了，还跟现在的世界第一申真谞下了一盘棋。我看到这个消息的时候特别感慨，十年了，围棋变了，AI更是变了。对，哈萨比斯自己也在社交媒体上感叹说'难以置信已经过去十年了'。你想想，2016年那会儿，AlphaGo四比一赢了李世石，整个科技圈、围棋圈都炸了。因为围棋一直被认为是AI最难攻克的棋类游戏嘛。对，我记得当时很多人说，AI下赢围棋至少还要十年二十年。结果突然就来了。你能给大家解释一下，围棋到底难在哪儿吗？为什么之前的AI搞不定？好，这个其实很直观。围棋棋盘是19乘19的，361个交叉点，每个点可以是黑子、白子或者空的。理论上棋局的状态空间大概是10的170次方——这个数字什么概念呢？整个可观测宇宙里所有原子加起来也才10的80次方。国际象棋呢，大概10的47次方。所以你用穷举的方式去搜索所有可能性，在围棋里完全不可能。AlphaGo之前最强的围棋AI也就业余中等水平，跟职业棋手差着十万八千里。那AlphaGo是怎么绕过这个问题的？它的核心思路其实很巧妙，用了两个神经网络加上蒙特卡洛树搜索。一个叫策略网络，负责预测下一步最可能走哪儿，这样就不用把所有可能性都看一遍了，大幅缩小搜索范围。另一个叫价值网络，负责评估当前局面谁更可能赢。然后蒙特卡洛树搜索呢，你可以理解为它会随机模拟很多盘棋，用统计结果来判断哪步更好。训练过程也很有意思——先用人类职业棋手的棋谱学，学完之后再自己跟自己下，不断进化。所以是'先学人类，再超越人类'。嗯，说到那场比赛，有两个瞬间我印象特别深。一个是AlphaGo第二局下出的第37手，当时解说都懵了；另一个是李世石第四局的'神之一手'。对！第37手当时所有职业棋手都觉得不可思议，说这步棋'超越人类认知'，完全颠覆了传统围棋对那个棋形的理解。而李世石第四局的第78手呢，是他在整个系列赛里唯一赢下的一局，被称为人类智慧在AI面前最闪耀的瞬间。你看，这两个瞬间放在一起，其实特别有意味——AI和人类各自展现了对方没有的东西。这次哈萨比斯回韩国，他特别提到一点，说他很好奇AlphaGo到底怎么改变了棋手们下棋的方式。这个变化大吗？太大了，可以说是颠覆性的。最直接的就是布局理论被全面刷新了。举个例子，围棋里有个位置叫'点三三'，就是棋盘角部三路和三路的交叉点。传统理论认为开局直接下点三三太保守、太局促，职业棋手一般都下星位或者小目。但AlphaGo和后来的AlphaGo Zero频繁在开局就下点三三，或者很早就对对手的星位进行点三三入侵。AI的分析表明，这些被人类忽视了几百年的下法，实际上在胜率上是有优势的。这直接动摇了围棋界'厚势优于实地'的主流价值观，整个布局理论体系都在重构。等于说下了几百年的棋，很多'常识'其实是偏见。就是这样！而且2017年的AlphaGo Zero更夸张——它完全不看人类棋谱，只知道围棋规则，纯靠自己跟自己下，40天就超越了所有前代版本。这说明什么？在规则明确的领域，AI从零开始自主探索，可能比模仿人类更高效。它甚至能发现人类几千年都没发现的策略。那现在的职业棋手是怎么用AI的？现在几乎所有顶级棋手都把AI当核心训练工具。申真谞就是典型的'AI训练'一代棋手，被公认是当今世界最强。棋手们日常就是跟AI对弈、分析AI推荐的走法来提升棋力。更深层的变化是思维模式——过去围棋界很讲'棋理'，靠经验和直觉，有点像师徒传承的味道。AI来了之后，大家发现很多被奉为圭臬的棋理其实有偏见，新一代棋手心态更开放了，不再盲从权威和传统。其实AlphaGo的意义远不止围棋本身。这十年DeepMind沿着这条路走了很远。嗯，这条线索特别清晰。AlphaGo验证了深度强化学习的巨大潜力，然后DeepMind把类似的思路用到了蛋白质结构预测上，做出了AlphaFold。蛋白质折叠问题困扰了生物学界50年——蛋白质的三维结构决定了它的功能，但从氨基酸序列预测三维结构极其困难，传统实验方法测一个结构可能要几个月甚至几年。2020年AlphaFold2直接达到了接近实验精度的预测水平，后来还公开了超过两亿个蛋白质的预测结构。哈萨比斯也因此拿了2024年诺贝尔化学奖。从下围棋到拿诺贝尔奖，这个跨度确实惊人。那从技术路线上看，AlphaGo跟现在的大语言模型之间有什么关联吗？有，而且关联比很多人想象的更紧密。AlphaGo是典型的'窄AI'，只能下围棋，不能干别的。但它用的强化学习思想，直接影响了后来大语言模型的训练方法。现在GPT、Gemini这些模型用的RLHF——就是从人类反馈中进行强化学习——这里面的强化学习思想跟AlphaGo是一脉相承的。再加上2017年Google提出的Transformer架构、大规模预训练范式的成熟，AI才从'只会一件事'进化到了现在这种能写代码、能理解图像、能做推理的通用能力。所以说AlphaGo是当今通用AI技术路线的重要先驱，一点不夸张。最后我想聊一个有意思的话题。李世石2019年退役的时候说AI是'不可战胜的存在'，听起来挺悲观的。但十年后回头看，AI真的'杀死'围棋了吗？恰恰相反。AlphaGo之后全球围棋人口显著增长了，围棋的竞技水平也达到了前所未有的高度。AI没有杀死围棋，反而让这项有几千年历史的游戏焕发了新的生命力。我觉得围棋的故事给了我们一个特别好的启示——AI可以成为人类认知的放大器，而不是替代者。它帮你看到你自己看不到的东西，但最终怎么理解、怎么运用，还是人的事。说得好。哈萨比斯跟李世石这次重逢，本身就挺有象征意味的——十年前是对手，十年后是老友。技术在飞速往前跑，但那些最具突破性的时刻，往往也是最有人情味的时刻。好，今天关于AlphaGo十周年就聊到这儿，这十年的故事，其实才刚刚开始。

AlphaGo十周年：哈萨比斯重返韩国与李世石重逢，AI如何改变围棋

更多播客

AI热点风向标·06月07日午间版

AI热点风向标·06月07日早间版

每日AI新鲜事·06月07日早间播报