连输10把！人类再次一败涂地！（星灵操控师）

不知道大家还记不记得

曾经力克世界职业围棋选手

最终击败李世乭、柯洁等人

无敌于围棋界的人工智能

AlphaGo

当时 AlphaGo

以惊人的学习能力

完美的战术

在很短的时间内

就从完全不会下围棋的新手

变成了称霸棋坛的 “ 大魔王 ”

虽然在无敌之后不久

研发 AlphaGo 的公司 DeepMind

就宣布 AlphaGo 正式退役

但是 DeepMind 的研究却没有停止

这一次他们的目标

是《星际争霸2 》

《星际争霸2 》是一款即时战略游戏，玩家通过操控游戏中的三个种族：人类（人族）、星灵（神族）、异虫（虫族），在地图上采集资源，制造建筑，最后训练部队，最终目的是消灭敌方的所有单位以及建筑来赢得胜利。

相较于围棋

竞技类游戏的操作更加复杂

反应时间也更短

战局瞬息万变

除了精准的操作外

战术的执行

也是赢得比赛的关键

关键在于《星际争霸2 》

这样的游戏还存在 “ 战争迷雾 ” 的设定

在没有探测的情况下

迷雾中的一切都是不确定的

这样一来就极大地提高了

AI 学习的难度

DeepMind 宣布进军《星际争霸2 》的消息

是 2016 年暴雪嘉年华期间

在这之后 DeepMind

和暴雪娱乐（星际争霸开发商）

共同推出了一款机器学习框架

可以让研究人员以及玩家

共同帮助 AI 加速学习

除此之外很长一段时间

DeepMind 都没有发布

和《星际争霸2 》相关的消息

直到北京时间 1 月 25 日凌晨 2 点

DeepMind 和暴雪娱乐

举办了一场网络直播

第一次向所有人展示了

DeepMind 的 AI 在这段时间里

对于《星际争霸2 》的学习成果

这一次直播上

DeepMind 放出的是去年 12 月份

DeepMind 的最新 AI AlphaStar

与两位现役星际争霸2 职业选手

TLO、MaNa 之间的比赛

AlphaStar 和他们各打五场

比赛地图是专门为此制作的

模式为神族对神族（ PVP ）

比赛的最终结果是 10 比 0

10 场比赛之中

短的只有五分钟

长的也就十分钟左右

胜者是

AlphaStar

这一次的直播除了复盘当时的战况

还请来了 TLO 以及 MaNa 到现场

让他们讲解当时对战的感受

这 DeepMind 真是*人诛心

好狠

。

从第一批录像中可以看出

AlphaStar 运用的战术

和平时人类玩家对战时

所使用的战术非常相似

AI也会在前期对敌方农民进行*扰

按理说职业选手

非常熟悉战术之间的克制

就算 AI 再厉害

也能打个有来有回

可是为什么却落了个

一败涂地的下场呢

这个版本的 AlphaStar

才学习了一个星期的《星际争霸2 》

但是这一个星期中

AlphaStar 进行的游戏次数

相当于人类打了 200 年《星际争霸2 》

就仿佛它是《龙珠》中的

精神时光屋里面修炼

而且还不带时间限制的那种

精神时光屋中一年等于外界一天，而且一生在里面只能待两年

TLO 说自己输了五场的原因

主要是没有预料到

AlphaStar 会这么强

他还提到

当他与 AlphaStar 对战时

感觉和人类玩家对战完全不一样

此外

在五场比赛中

AlphaStar 运用的战术都不相同

让人完全无法预测

简直就和哆啦 A 梦一样

你永远不知道它会从口袋里掏出什么来

另外还有一点

TLO 其实是一位专精虫族的选手

神族虽然也有大师级别

但是和职业水准还是有很大差距的

他自己也说

如果能给他再多点时间练习

他有把握击败 AlphaStar

那么如果说

换一位专精神族的职业选手

和 AlphaStar 打

是不是就能赢了呢

也许是吧

因为在 TLO 之后被击败的 MaNa

就是一名神族职业选手

世界前 10 的神族玩家

不过这个时候的 AlphaStar

比击败 TLO 的那个版本

又多学习了一个星期

变得更加强大了

在 MaNa 与 AlphaStar 对战时

即便有时候 MaNa 利用游戏中的

兵种克制

以及一些*扰战术

取得过一定优势

却最终都输掉了比赛

赛后统计显示

AlphaStar 的 APM 中值是 277

（ APM 是指每分钟操作次数，俗称手速）

而职业选手的 APM 中值则高达 559

按理说职业选手的操作速度更快

不可能输给 AlphaStar 才对

然而实际上

即便是职业选手

他们的操作之中也会有着大量的

“ 无效操作 ” 或者 “ 废操作 ”

因此 APM 并不能代表一切

甚至有很大水分

实际上的有效操作（ EPM ）

估计只有三四分之一

AlphaStar 则不一样

在它的操作中

几乎没有废操作

精准无比

所以它的 APM 几乎可以看做全是 EPM

在涉及很多单位的战斗时

AlphaStar 可以精确地计算损失

将残血单位拖到队伍后方进行保护

同时还能继续保持火力

有效减少单位伤亡

而职业选手则会有疏漏的时候

许多操作无法精确到每一个单位

因此两位职业选手可以说是毫无还手之力

都以 0-5 的比分输给了 AlphaStar

在此期间

DeepMind 的人公布过一组后台数据

显示了 AlphaStar 的神经网络活动

AlphaStar 在第二场比赛中

对自己胜率的预测

一开始就高达 70%

并且很快就冲上 100%

再也没下来过

也就是说 AlphaStar 在两分钟左右

就已经认定

这场比赛它会赢

事实正如 AlphaStar 预测的一样

MaNa 又输了

而且 AlphaStar 在陷入劣势局面时

也并不会受到影响

只会按照自身逻辑

去寻找获胜概率最大的选择

比如上图中

AlphaStar 的追猎者部队

由于兵种被克制

被 MaNa 的不朽者追着打

不论是解说

还是观战的我

都觉得 MaNa 会赢下这一局

如果对方是一名人类选手

基本也就会打出 GG

AlphaStar 却给了所有人当头一棒

它居然利用弱势部队

引诱 MaNa 深入了一个盆地

并且利用自己的部队

对 MaNa 的部队

形成了三路合围

歼灭了 MaNa 的部队

一举反败为胜

这意味着

AlphaStar 已经开始利用地形

实施一些高级战术了

最终

MaNa 也以 0-5 的比分

输给了 AlphaStar

MaNa 在现场解释道

AlphaStar 的操作

不是人类可以办到的

在混战之中

几乎没有可能做到

像 AlphaStar 一样

照顾到每一个作战单位

因为 AlphaStar 的视野

和玩家不一样

它不需要把屏幕移到某个地方

就能看到那个地区属于自己的单位

并且进行操作

这样既节省了操作时间

也能更快做出更好的战略选择

在这次直播的最后

MaNa 时隔一个多月

又一次向 AlphaStar

发起了挑战

并且会全程进行直播

在这一次的比赛中

AlphaStar 的 “ 视觉能力 ” 受到了限制

（原本它就像是上帝视角，可以纵观全局）

反而使得这局比赛的过程

堪比真正的职业竞赛

双方各自的操作战术

都达到了巅峰

每次战斗

AlphaStar 都能及时撤回血量不足的单位

MaNa 也把自己的多线操作发挥了出来

不停地进行*扰

最后 MaNa 依靠巨大的兵力优势

歼灭了 AlphaStar 的所有部队

拆掉了 AlphaStar 的最后一个建筑

终于赢了一次 AlphaStar

艰难地为人类取下了一分

将这一次的 “ 人机大战 ” 的比分

最终定格在了 10:1

他本人也是很激动

比赛结束后

MaNa 说自己在比赛中感觉到

AlphaStar 的一些逻辑上

还是有一些缺陷

有时候会有一些比较莫名的操作

他正是利用了这些小机会

赢得了胜利

根据 DeepMind 的人所说

他们现阶段正在让 AlphaStar

学习以神族对抗其他种族

并且打算在 20 天后挑战另一名

韩国虫族职业选手

众所周知

韩国星际争霸2 职业选手

才代表了当今世界最强水平

不知道那时候他们还能不能击败

更加完美的 AlphaStar

这次的直播以及后续事件

总让我产生了一种既视感

仿佛看到了当年

AlphaGo 默默地自我学习

到挑战职业棋手

最后无敌于世的过程

在此之前

已经有很多的职业领域

都受到了 AI 的冲击

并且 AI 的表现都超过人类

现在连最具观赏性的竞技游戏也不例外

如果有一天

连 AI 训练领域都可以用 AI 替代

也就是 AI 可以 “ 自我繁殖 ” 了

地球是不是真的就不需要人类了呢？