不知道大家还记不记得
曾经力克世界职业围棋选手
最终击败李世乭、柯洁等人
无敌于围棋界的人工智能
AlphaGo
当时 AlphaGo
以惊人的学习能力
完美的战术
在很短的时间内
就从完全不会下围棋的新手
变成了称霸棋坛的 “ 大魔王 ”
虽然在无敌之后不久
研发 AlphaGo 的公司 DeepMind
就宣布 AlphaGo 正式退役
但是 DeepMind 的研究却没有停止
这一次他们的目标
是《 星际争霸2 》
《 星际争霸2 》是一款即时战略游戏,玩家通过操控游戏中的三个种族:人类( 人族 )、星灵( 神族 )、异虫( 虫族 ),在地图上采集资源,制造建筑,最后训练部队,最终目的是消灭敌方的所有单位以及建筑来赢得胜利。
相较于围棋
竞技类游戏的操作更加复杂
反应时间也更短
战局瞬息万变
除了精准的操作外
战术的执行
也是赢得比赛的关键
关键在于《 星际争霸2 》
这样的游戏还存在 “ 战争迷雾 ” 的设定
在没有探测的情况下
迷雾中的一切都是不确定的
这样一来就极大地提高了
AI 学习的难度
DeepMind 宣布进军《 星际争霸2 》的消息
是 2016 年暴雪嘉年华期间
在这之后 DeepMind
和暴雪娱乐( 星际争霸开发商 )
共同推出了一款机器学习框架
可以让研究人员以及玩家
共同帮助 AI 加速学习
除此之外很长一段时间
DeepMind 都没有发布
和《 星际争霸2 》相关的消息
直到北京时间 1 月 25 日凌晨 2 点
DeepMind 和暴雪娱乐
举办了一场网络直播
第一次向所有人展示了
DeepMind 的 AI 在这段时间里
对于《 星际争霸2 》的学习成果
这一次直播上
DeepMind 放出的是去年 12 月份
DeepMind 的 最新 AI AlphaStar
与两位现役星际争霸2 职业选手
TLO、MaNa 之间的比赛
AlphaStar 和他们各打五场
比赛地图是专门为此制作的
模式为神族对神族( PVP )
比赛的最终结果是 10 比 0
10 场比赛之中
短的只有五分钟
长的也就十分钟左右
胜者是
AlphaStar
这一次的直播除了复盘当时的战况
还请来了 TLO 以及 MaNa 到现场
让他们讲解当时对战的感受
这 DeepMind 真是*人诛心
好狠
。
。
。
从第一批录像中可以看出
AlphaStar 运用的战术
和平时人类玩家对战时
所使用的战术非常相似
AI也会在前期对敌方农民进行*扰
按理说职业选手
非常熟悉战术之间的克制
就算 AI 再厉害
也能打个有来有回
可是为什么却落了个
一败涂地的下场呢
这个版本的 AlphaStar
才学习了一个星期的《 星际争霸2 》
但是这一个星期中
AlphaStar 进行的游戏次数
相当于人类打了 200 年《 星际争霸2 》
就仿佛它是《龙珠》中的
精神时光屋里面修炼
而且还不带时间限制的那种
精神时光屋中一年等于外界一天,而且一生在里面只能待两年
TLO 说自己输了五场的原因
主要是没有预料到
AlphaStar 会这么强
他还提到
当他与 AlphaStar 对战时
感觉和人类玩家对战完全不一样
此外
在五场比赛中
AlphaStar 运用的战术都不相同
让人完全无法预测
简直就和哆啦 A 梦一样
你永远不知道它会从口袋里掏出什么来
另外还有一点
TLO 其实是一位专精虫族的选手
神族虽然也有大师级别
但是和职业水准还是有很大差距的
他自己也说
如果能给他再多点时间练习
他有把握击败 AlphaStar
那么如果说
换一位专精神族的职业选手
和 AlphaStar 打
是不是就能赢了呢
也许是吧
因为在 TLO 之后被击败的 MaNa
就是一名神族职业选手
世界前 10 的神族玩家
不过这个时候的 AlphaStar
比击败 TLO 的那个版本
又多学习了一个星期
变得更加强大了
在 MaNa 与 AlphaStar 对战时
即便有时候 MaNa 利用游戏中的
兵种克制
以及一些*扰战术
取得过一定优势
却最终都输掉了比赛
赛后统计显示
AlphaStar 的 APM 中值是 277
( APM 是指每分钟操作次数,俗称手速 )
而职业选手的 APM 中值则高达 559
按理说职业选手的操作速度更快
不可能输给 AlphaStar 才对
然而实际上
即便是职业选手
他们的操作之中也会有着大量的
“ 无效操作 ” 或者 “ 废操作 ”
因此 APM 并不能代表一切
甚至有很大水分
实际上的有效操作( EPM )
估计只有三四分之一
AlphaStar 则不一样
在它的操作中
几乎没有废操作
精准无比
所以它的 APM 几乎可以看做全是 EPM
在涉及很多单位的战斗时
AlphaStar 可以精确地计算损失
将残血单位拖到队伍后方进行保护
同时还能继续保持火力
有效减少单位伤亡
而职业选手则会有疏漏的时候
许多操作无法精确到每一个单位
因此两位职业选手可以说是毫无还手之力
都以 0-5 的比分输给了 AlphaStar
在此期间
DeepMind 的人公布过一组后台数据
显示了 AlphaStar 的神经网络活动
AlphaStar 在第二场比赛中
对自己胜率的预测
一开始就高达 70%
并且很快就冲上 100%
再也没下来过
也就是说 AlphaStar 在两分钟左右
就已经认定
这场比赛它会赢
事实正如 AlphaStar 预测的一样
MaNa 又输了
而且 AlphaStar 在陷入劣势局面时
也并不会受到影响
只会按照自身逻辑
去寻找获胜概率最大的选择
比如上图中
AlphaStar 的追猎者部队
由于兵种被克制
被 MaNa 的不朽者追着打
不论是解说
还是观战的我
都觉得 MaNa 会赢下这一局
如果对方是一名人类选手
基本也就会打出 GG
AlphaStar 却给了所有人当头一棒
它居然利用弱势部队
引诱 MaNa 深入了一个盆地
并且利用自己的部队
对 MaNa 的部队
形成了三路合围
歼灭了 MaNa 的部队
一举反败为胜
这意味着
AlphaStar 已经开始利用地形
实施一些高级战术了
最终
MaNa 也以 0-5 的比分
输给了 AlphaStar
MaNa 在现场解释道
AlphaStar 的操作
不是人类可以办到的
在混战之中
几乎没有可能做到
像 AlphaStar 一样
照顾到每一个作战单位
因为 AlphaStar 的视野
和玩家不一样
它不需要把屏幕移到某个地方
就能看到那个地区属于自己的单位
并且进行操作
这样既节省了操作时间
也能更快做出更好的战略选择
在这次直播的最后
MaNa 时隔一个多月
又一次向 AlphaStar
发起了挑战
并且会全程进行直播
在这一次的比赛中
AlphaStar 的 “ 视觉能力 ” 受到了限制
( 原本它就像是上帝视角,可以纵观全局 )
反而使得这局比赛的过程
堪比真正的职业竞赛
双方各自的操作战术
都达到了巅峰
每次战斗
AlphaStar 都能及时撤回血量不足的单位
MaNa 也把自己的多线操作发挥了出来
不停地进行*扰
最后 MaNa 依靠巨大的兵力优势
歼灭了 AlphaStar 的所有部队
拆掉了 AlphaStar 的最后一个建筑
终于赢了一次 AlphaStar
艰难地为人类取下了一分
将这一次的 “ 人机大战 ” 的比分
最终定格在了 10:1
他本人也是很激动
比赛结束后
MaNa 说自己在比赛中感觉到
AlphaStar 的一些逻辑上
还是有一些缺陷
有时候会有一些比较莫名的操作
他正是利用了这些小机会
赢得了胜利
根据 DeepMind 的人所说
他们现阶段正在让 AlphaStar
学习以神族对抗其他种族
并且打算在 20 天后挑战另一名
韩国虫族职业选手
众所周知
韩国星际争霸2 职业选手
才代表了当今世界最强水平
不知道那时候他们还能不能击败
更加完美的 AlphaStar
这次的直播以及后续事件
总让我产生了一种既视感
仿佛看到了当年
AlphaGo 默默地自我学习
到挑战职业棋手
最后无敌于世的过程
在此之前
已经有很多的职业领域
都受到了 AI 的冲击
并且 AI 的表现都超过人类
现在连最具观赏性的竞技游戏也不例外
如果有一天
连 AI 训练领域都可以用 AI 替代
也就是 AI 可以 “ 自我繁殖 ” 了
地球是不是真的就不需要人类了呢?
Copyright © 2024 妖气游戏网 www.17u1u.com All Rights Reserved