澳洲新闻在线 - 澳大利亚华人媒体新闻网站|澳洲新闻|悉尼新闻|国际新闻头条|No.1 Online Chinese News Australia › 中国新闻 › 查看内容

柯洁对战AlphaGo，首战告负！6个问题，带你弄清这只“狗”

2017-5-24 09:24| 发布者: hubert | 评论: 0 |来自: 果壳网

导读: 千年水乡乌镇迎来一场举世瞩目的围棋峰会。在为期一周的峰会中，“世界第一围棋AI”AlphaGo将与中国围棋职业九段棋手柯洁对弈三场。并与其他知名中国棋手一起进行团队赛和配对赛。

第一日对战结果

就在刚刚，柯洁与AlphaGo结束了三番棋的第一局，AlphaGo执白 1/4子胜。这也是中国围棋中最微小的胜负。

迄今为止的公开赛事中，AlphaGo VS. 人类围棋选手，战绩已达70胜1负。本文首发微博@天了噜小组长，抱着Logo的那只蠢猫据说是小组长本人。

在赛后新闻发布会上，柯洁表示：“（阿尔法狗）实在下得太出色了，我输的也没什么脾气，真的是很厉害。”

AlphaGo是谁？为什么这场对决会如此受人关注？这篇文章会为你梳理事情的全貌。

① AlphaGo是什么？

AlphaGo是由英国Google DeepMind公司开发的围棋人工智能程序。它可能是有史以来最强大的围棋棋手。

DeepMind公司于2010年由杰米斯·哈萨比斯（Demis Hassabis）博士、沙恩·莱吉（Shane Legg）博士和穆斯塔法·苏雷曼（Mustafa Suleyman）共同创立。其中，哈萨比斯和莱吉相识于伦敦大学学院盖茨比计算神经科学组。

与其说是一间创业公司，DeepMind看起来更像是一家致力于新技术的实验室。他们的项目包括创造一个能够以和人类一样的方式“学习”如何玩游戏并达到高水平的人工智能。在只用原始像素和游戏得分作为输入数据的情况下，他们的程序学会了包括《乓》（Pong）和《打砖块》（Breakout）在内的多种游戏的玩法，并达到了超人的水平。

2014年，DeepMind被谷歌以4亿美元收购。同年，AlphaGo项目诞生，开始一步步向围棋游戏的巅峰发起挑战。

“在‘深蓝’战胜卡斯帕罗夫之后，围棋就成了游戏AI最后的圣杯。”哈萨比斯说。

② AlphaGo和人下围棋战绩如何？

在今日对战之前，所有公开赛事中，AlphaGo与人类围棋选手较量的战绩是——69胜1负。

2015年10月，AlphaGo在没有任何让子的情况下，以5：0的悬殊比分击溃欧洲围棋冠军樊麾二段。

2016年3月，韩国职业棋手李世石九段迎战AlphaGo，以1：4不幸败北。此战之初，柯洁曾断言李会以5：0的比分大胜，AlphaGo毫无胜算。但在李世石输掉第三盘后，柯洁也不得不承认计算机的实力强大。表示“跟AlphaGo下的话，同样的条件下，我输的可能性非常大”。

第一场对战的最后时分。之后，李世乭投子认输。

2016年12月，神秘棋手“Master”登录中国弈城围棋网，以每天十盘的速度接连击败中外各大顶尖棋手，取得了空前绝后的60连胜。人们耳熟能详的职业棋手如古力、常昊等纷纷被斩落马下，柯洁也不幸成为它的手下败将。在输给Master后，柯洁身体抱恙住院。2017年1月4日，AlphaGo团队公布“Master”背后正是升级版AlphaGo的这一事实。

曾经，柯洁用“震撼”来形容AlphaGo带给围棋界的感受，但同时也表示人类还会变得更强。如今，在乌镇的围棋峰会上，柯洁将在5天内与AlphaGo交锋三局。现在，第一局已经结束，AlphaGo以1/4子的优势险胜柯洁。之后两局，胜负将会如何呢？

③ AlphaGo对决柯洁，大家怎么看？

考虑到人工智能在网络快棋中的先天优势，目前人们仍未能断言AlphaGo在允许人类思考更长时间的慢棋中表现同样良好。不过，谈及乌镇围棋峰会上柯洁对阵AlphaGo的可能结果，人类棋手表现得非常悲观。

中国“棋圣”聂卫平表示，他认为柯洁会被0：3击溃。古力九段认为，如果柯洁发挥出100%的状态，那么他也许有5%的胜率。而曾经狂傲地认为“阿尔法狗战胜不了我”的柯洁，也谦虚地表示：“这次能代表人类出战是我的荣幸，我将尽全力去争胜，一决胜负，抱有必胜的信念和必死的决心，不轻易言败。”

古力（左一）、樊麾（左三）、聂卫平（右二）、柯洁（右一）与谷歌CEO桑德尔·皮蔡（左二）一起探讨AlphaGo的棋艺。

哈萨比斯则在博客中期待柯洁能将AlphaGo的表现逼到极限，乃至超越极限。同时，由陈耀烨九段、周睿羊九段、芈昱廷九段、时越九段和唐韦星九段组成的团队也会与AlphaGo进行一场较量。哈萨比斯希望他们能够测试AlphaGo的创造力和适应能力到底在什么水平。

④ AlphaGo到底是怎么下棋的？

在一局围棋中，平均每一步的下法大约有200种可能。棋盘上可能出现的局面总数到了远大于宇宙中原子总数的地步。因此，通过暴力穷举手段预测所有的可能情况并从中筛选中最优势走法的思路，并不适用于围棋AI。

围棋棋盘上出现的可能局面数远大于宇宙中的原子数量。

AlphaGo选择了别的下棋方式。支撑AlphaGo提高棋力、打败人类选手的“秘诀” 有三个：深度神经网络、监督/强化学习、蒙特卡罗树搜索。

提示

此处涉及部分专业术语

深度神经网络是包含超过一个认知层的计算机神经网络。对于人工智能而言，世界是被用数字的方式呈现的。人们将人工智能设计出不同的“层”，来解决不同层级的认知任务。这种具备许多“层”的神经网络，被称为深度神经网络。AlphaGo包含两种深度神经网络：价值网络和策略网络。价值网络使得AlphaGo能够明晰局势的判断，左右全局“战略”，抛弃不合适的路线；策略网络使得AlphaGo能够优化每一步落子，左右局部“战术”，减少失误。两者结合在一起，使得AlphaGo不需要过于庞大的计算也能够走出精妙的棋局，就像人类一样。

AlphaGo与柯洁对弈中，Google团队依然由黄士杰博士代替AlphaGo落子。

监督学习和强化学习是机器学习方式的不同种类。监督学习是指机器通过人类输入的信息进行学习，而加强学习是指机器自身收集环境中的相关信息作出判断，并综合成自己的“经验”。在初始阶段，AlphaGo收集研究者输入的大量棋局数据，学习人类棋手的下法，形成自己独特的判断方式。之后，在不计其数的自己与自己模拟对弈，以及每一次与人类棋手对弈中，AlphaGo都能并根据结果来总结并生成新的范式，实现自我提高。

最后，蒙特卡洛树是一种搜索算法。AI在利用它进行决策判断时，会从根结点开始不断选择分支子结点，通过不断的决策使得游戏局势向AI预测的最优点移动，直到模拟游戏胜利。AI每一次的选择都会同时产生多个可能性，它会进行仿真运算，推断出可能的结果再做出决定。

AlphaGo中的蒙特卡罗树搜索流程。

⑤ 除了AlphaGo，围棋AI哪家强？

依赖于上述三大“武器”，AlphaGo成为了目前人类制造出来的最为优秀的围棋AI。连败人类棋手的胜绩就是明证。但除了它之外，世界各国也开发过不同的游戏AI，向围棋这一智力上的“绝对领域”发起挑战。

法国研发的Crazy Stone（狂石），日本研发的Zen（天顶）都曾是这一领域的翘楚。它们都曾经给人类造成过威胁，但从未像AlphaGo一样将最顶级的人类棋手打的一败涂地。在AlphaGo一举走红之后，人工智能界对围棋AI的研发热情空前高涨。

Zen的改良版DeepZenGO在2017年3月参加了日本举办的“世界最强棋手决定战”，先后负于中国棋手芈昱廷九段和韩国棋手朴廷桓九段后，战胜日本棋手井山裕太九段，取得第三名的成绩。

由中国腾讯公司研发的围棋AI“绝艺”（Fine Art）于2016年3月后完成，同年8月23日首次战胜职业棋手。11月2日，绝艺战胜世界冠军江维杰九段。11月19日，绝艺与柯洁九段交手，取得了一胜一负的成绩。如今，绝艺对世界冠军和全国冠军的胜率，已经能够维持在90%以上了。

⑥ 弄一个谁都打不过的围棋AI，有什么用？

在多年的呕心沥血后，AlphaGo和一系列崛起的围棋AI一起成为了围棋界新的高峰。毋庸置疑，它们的下棋方式会改变人们目前对围棋下法的观念。许多曾经的定势将会被打破，新的格局即将开始。也许在若干年后的围棋教科书上，流传多年颠扑不破的真理将会被改写。可是，花了那么多人力物力，研究者们想做的，就只是这样一个能够下赢人类的AI吗？

当然不是。