AlpjaGO Zero 现身，人类已经是拖累了（棱镜赛跑者）

相信大家对AlphaGo 的事迹还记忆犹新。16年初战胜欧洲冠军，16年三月战胜李世石，今年年初下快棋横扫整个人类棋坛，5月份战胜柯洁等。此后，AlphaGo 团队宣布不再参加公开围棋比赛。

记得当时还有很多人愤愤不平，觉得假以时日想出奇招一定还有胜的机会。不过昨天 Google Deepmind在顶级期刊 Nature 上发的一篇论文，把这个幻想粉碎了。

这篇论文的名字叫做 Mastering the game of Go without human knowledge，《不使用人类知识掌握围棋》，借用一篇报告的文字，它告诉了我们这样一个故事：

去年，有个小孩读遍人世所有的棋谱，辛勤打谱，苦思冥想，花了几个月，棋艺精进，4-1 打败世界冠军李世石之后，人间再无敌手。他的名字叫 AlphaGo（阿法狗）。
今年，他的弟弟只靠一副棋盘和黑白两子，没看过一个棋谱，也没有一个人指点，从零开始，自娱自乐，自己参悟，三天之后，100-0 打败哥哥 AlphaGo。他的名字叫 AlphaGo Zero（阿法元）。

而且 AlphaGo 用了48个 TPU（用于 AI 的计算单元），AlphaGo Zero 只用了4个。

对了，大家知道 Go 是日语里围棋的说法（论文的标题也用了这个词），而日本游戏动漫里也相当喜欢 Zero 这个词（具体不展开），说团队没有相关爱好者小磕是不信的。当然，技术宅和 ACGN 宅本来就重合度很高，这个正常。

回到正题，很明显，在围棋这个领域，人类其实把 AlphaGo 带到沟里去了！项目负责人 David Silver 博士表示，AlphaGo Zero 远比 AlphaGo 强大，因为它不再被人类认知所局限，能够发现新知识，发展新策略。

具体看棋局的话，其实 AlphaGO Zero（以下简称 Zero）的开局和收官跟人类专业棋手的下法差不多，重点在于中盘在人类看来相当诡异。小磕的理解是，开局和收官变数较少，比较容易得出最优的结论，所以人类琢磨了几千年之后，还是能找到优化的解。而中盘双方的下法千变万化，以人类的计算能力完全没法胜任，所以几千年的积累是想办法把问题简化到人类可以计算的程度，然后找出“局部”最优解，而实际上离全局的最优解相差甚远。AI 在这方面比人类强太多。

不过 Deepmind 的研究不是来羞辱人类的，Zero 在 AI 领域是一个很大的突破。目前的人工智能深度学习模型，主要是采用了传统增强学习技术再加上深度神经网络 DNN 完成搭建，基本的流程是，给 AI 出一堆同类的问题，然后人工对回答进行对错批改，AI 再根据这个反馈对算法进行修正（具体怎么修正小磕以前写过）。

举例来说，我们经常会遇到的验证码，如果你见过这个行业领先的 reCAPTCHA 的验证码，前几年常常给你一张门的照片让你输入门牌号，而现在则是给你 N 张照片让你找出里面包含某个物体（例如公交车）的。不知道你有没有奇怪过，为什么它家验证码是这样的呢？

答案很简单，这是为了训练 AI。验证码公司有一个图片库，其中有一小部分是人工标识过的——也就是标出图中是什么，而大部分是没有标过的。然后当用户要验证时，先用标识过的图片确认用户是人类之后，就给出未标识过的，然后把用户输入跟 AI 的回答做比对。没错，用户就这样成为了免费的 AI 训练师。

当前AI 领域的大牛之一——具体来说是计算机视觉领域——Stanford 的华人科学家李菲菲教授，之前就是因为用了一个人工标识过的很大的图片库训练 AI，后来声名鹊起。当然训练只是研究的开始。

但是这种训练方式显然有一个问题，就是需要用大量人工标识过的数据来喂养 AI，而这类数据并不是那么丰富。图片还好，只要付出大量的人力，像比如说医疗领域某一个不那么常见的病症，可能全世界的病历也不过几万例，这对目前的学习模式是远远不够的。

而 Zero 的成功无疑揭示了，采用最新的 AI 技术（这也是 Zero 比前代更先进的地方），只要结果容易判断，AI 可以自己学习，摆脱对大量人工标识的需求。如果这种方式能铺开使用，一定会让 AI 在各种应用中发挥更大的力量。例如 David Silver 博士就认为，相关的技术可以在蛋白质折叠、减少能源消耗和新材料研究等领域（protein folding, reducing energy consumption or searching for revolutionary new materials）大显身手。

当然，围棋是有明确输赢的，比起现实中很多问题要简单得多。所以美国好几位 AI 领域的专家在对论文表示肯定之后，也表达了一些担忧：AI 在历史上已经火过几次，但每次最后都发现实际的能力离预想的相差甚远，大量的人只是在吹泡泡而已，这次也需要好好观察。

不过 Zero 的成功到底提醒了我们，人类的智力究竟极为有限，被 AI 秒是迟早的事情……尽管人类发明了汽车还是有赛跑，但是汽车毕竟是个纯粹的工具（也只是目前了），而 AI 显然完全不同……