十年前有一场比赛,让全世界都屏住了呼吸——AlphaGo对战李世石。最近啊,DeepMind的创始人哈萨比斯重返韩国,跟李世石重逢了,还跟现在的世界第一申真谞下了一盘棋。我看到这个消息的时候特别感慨,十年了,围棋变了,AI更是变了。
对,哈萨比斯自己也在社交媒体上感叹说'难以置信已经过去十年了'。你想想,2016年那会儿,AlphaGo四比一赢了李世石,整个科技圈、围棋圈都炸了。因为围棋一直被认为是AI最难攻克的棋类游戏嘛。
对,我记得当时很多人说,AI下赢围棋至少还要十年二十年。结果突然就来了。你能给大家解释一下,围棋到底难在哪儿吗?为什么之前的AI搞不定?
好,这个其实很直观。围棋棋盘是19乘19的,361个交叉点,每个点可以是黑子、白子或者空的。理论上棋局的状态空间大概是10的170次方——这个数字什么概念呢?整个可观测宇宙里所有原子加起来也才10的80次方。国际象棋呢,大概10的47次方。所以你用穷举的方式去搜索所有可能性,在围棋里完全不可能。AlphaGo之前最强的围棋AI也就业余中等水平,跟职业棋手差着十万八千里。
那AlphaGo是怎么绕过这个问题的?
它的核心思路其实很巧妙,用了两个神经网络加上蒙特卡洛树搜索。一个叫策略网络,负责预测下一步最可能走哪儿,这样就不用把所有可能性都看一遍了,大幅缩小搜索范围。另一个叫价值网络,负责评估当前局面谁更可能赢。然后蒙特卡洛树搜索呢,你可以理解为它会随机模拟很多盘棋,用统计结果来判断哪步更好。训练过程也很有意思——先用人类职业棋手的棋谱学,学完之后再自己跟自己下,不断进化。所以是'先学人类,再超越人类'。
嗯,说到那场比赛,有两个瞬间我印象特别深。一个是AlphaGo第二局下出的第37手,当时解说都懵了;另一个是李世石第四局的'神之一手'。
对!第37手当时所有职业棋手都觉得不可思议,说这步棋'超越人类认知',完全颠覆了传统围棋对那个棋形的理解。而李世石第四局的第78手呢,是他在整个系列赛里唯一赢下的一局,被称为人类智慧在AI面前最闪耀的瞬间。你看,这两个瞬间放在一起,其实特别有意味——AI和人类各自展现了对方没有的东西。
这次哈萨比斯回韩国,他特别提到一点,说他很好奇AlphaGo到底怎么改变了棋手们下棋的方式。这个变化大吗?
太大了,可以说是颠覆性的。最直接的就是布局理论被全面刷新了。举个例子,围棋里有个位置叫'点三三',就是棋盘角部三路和三路的交叉点。传统理论认为开局直接下点三三太保守、太局促,职业棋手一般都下星位或者小目。但AlphaGo和后来的AlphaGo Zero频繁在开局就下点三三,或者很早就对对手的星位进行点三三入侵。AI的分析表明,这些被人类忽视了几百年的下法,实际上在胜率上是有优势的。这直接动摇了围棋界'厚势优于实地'的主流价值观,整个布局理论体系都在重构。
等于说下了几百年的棋,很多'常识'其实是偏见。
就是这样!而且2017年的AlphaGo Zero更夸张——它完全不看人类棋谱,只知道围棋规则,纯靠自己跟自己下,40天就超越了所有前代版本。这说明什么?在规则明确的领域,AI从零开始自主探索,可能比模仿人类更高效。它甚至能发现人类几千年都没发现的策略。
那现在的职业棋手是怎么用AI的?
现在几乎所有顶级棋手都把AI当核心训练工具。申真谞就是典型的'AI训练'一代棋手,被公认是当今世界最强。棋手们日常就是跟AI对弈、分析AI推荐的走法来提升棋力。更深层的变化是思维模式——过去围棋界很讲'棋理',靠经验和直觉,有点像师徒传承的味道。AI来了之后,大家发现很多被奉为圭臬的棋理其实有偏见,新一代棋手心态更开放了,不再盲从权威和传统。
其实AlphaGo的意义远不止围棋本身。这十年DeepMind沿着这条路走了很远。
嗯,这条线索特别清晰。AlphaGo验证了深度强化学习的巨大潜力,然后DeepMind把类似的思路用到了蛋白质结构预测上,做出了AlphaFold。蛋白质折叠问题困扰了生物学界50年——蛋白质的三维结构决定了它的功能,但从氨基酸序列预测三维结构极其困难,传统实验方法测一个结构可能要几个月甚至几年。2020年AlphaFold2直接达到了接近实验精度的预测水平,后来还公开了超过两亿个蛋白质的预测结构。哈萨比斯也因此拿了2024年诺贝尔化学奖。
从下围棋到拿诺贝尔奖,这个跨度确实惊人。那从技术路线上看,AlphaGo跟现在的大语言模型之间有什么关联吗?
有,而且关联比很多人想象的更紧密。AlphaGo是典型的'窄AI',只能下围棋,不能干别的。但它用的强化学习思想,直接影响了后来大语言模型的训练方法。现在GPT、Gemini这些模型用的RLHF——就是从人类反馈中进行强化学习——这里面的强化学习思想跟AlphaGo是一脉相承的。再加上2017年Google提出的Transformer架构、大规模预训练范式的成熟,AI才从'只会一件事'进化到了现在这种能写代码、能理解图像、能做推理的通用能力。所以说AlphaGo是当今通用AI技术路线的重要先驱,一点不夸张。
最后我想聊一个有意思的话题。李世石2019年退役的时候说AI是'不可战胜的存在',听起来挺悲观的。但十年后回头看,AI真的'杀死'围棋了吗?
恰恰相反。AlphaGo之后全球围棋人口显著增长了,围棋的竞技水平也达到了前所未有的高度。AI没有杀死围棋,反而让这项有几千年历史的游戏焕发了新的生命力。我觉得围棋的故事给了我们一个特别好的启示——AI可以成为人类认知的放大器,而不是替代者。它帮你看到你自己看不到的东西,但最终怎么理解、怎么运用,还是人的事。
说得好。哈萨比斯跟李世石这次重逢,本身就挺有象征意味的——十年前是对手,十年后是老友。技术在飞速往前跑,但那些最具突破性的时刻,往往也是最有人情味的时刻。好,今天关于AlphaGo十周年就聊到这儿,这十年的故事,其实才刚刚开始。