想必大家小时候应该都玩过捉迷藏的游戏吧?那么最近OpenAI 就发表了一项成果,最后的结果甚至连研究人员自己都吓了一跳,惊呆了不少业内人士和吃瓜群众。
OpenAI,由诸多硅谷大亨联合建立的人工智能非营利组织。2015年马斯克与其他硅谷科技大亨进行连续对话后,决定共同创建OpenAI,希望能够预防人工智能的灾难性影响,推动人工智能发挥积极作用。特斯拉电动汽车公司与美国太空技术探索公司SpaceX创始人马斯克、Y Combinator总裁阿尔特曼、天使投资人彼得·泰尔(Peter Thiel)以及其他硅谷巨头去年12月份承诺向OpenAI注资10亿美元。
OpenAI的研究人员们让AI去学习玩捉迷藏的游戏。
在一个相对固定的空间中,有当鬼的跟被抓的两组人,当鬼的这组人游戏初始阶段会被锁定无法移动。在这短时间内,被抓的这组人可以任意行动。空间里有不能移动的墙壁和可以移动的各种形状的物体,这些物体允许被双方的人搬动,或是选择将它锁定,锁定后对方就无法搬动了。
然后,他们就让AI中的两组人自己去玩这个游戏了。
游戏的两组人基本就是毫无逻辑的随处移动。在这个阶段,只要游戏的时间足够长,当鬼的那组通常都能顺利抓到人,或者说是瞎猫碰到死耗子啦。
但是当实验往下进行的时候,神奇的事情就开始接二连三地发生啦!
那大约跑了200多万次实验后,当鬼的那组似乎意识到如何去抓人了。他们开始有意识地往被抓的那组人移动了。当实验进行到800万次左右,研究人员发现被抓的这组人也开始觉醒了。
他们发现到箱子可以搬动,并且对箱子进行锁定,甚至于他们还进行了明确的分工。被抓的这组,两人各拿一个箱子用来封堵入口,然后迅速再对箱子进行锁定。那么显然,这时候被抓的这组人的胜率就高于当鬼的那组了。
到了大约1400万次实验后,当鬼的那组终于发现旁边还有一个斜坡状的物体。他们发现只要把斜坡靠在墙边,就可以通过斜坡翻过墙壁去抓人。这个时候当鬼的这组胜率开始提高了。
但实验还没完!
到了4000多万次的时候,被抓的这组开始意识到这块斜坡了。于是他们慢慢学会趁游戏开始之前先把斜坡抢进来,然后再推方块去挡门。这样当鬼的就没办法用斜坡翻墙了。
到这里看起来,这个策略已经很想人类在玩的了吧。但这完全是AI自己摸索出来的,真的很厉害!
到这里第一阶段就算结束了。
他们让两组AI在比较开放的场地玩捉迷藏,一开始双方也是乱走,后来当鬼的学会去抓人。
不过当实验进行到八千万次以后,被抓的这组居然学会用场地中的物体来搭建掩蔽物。让鬼没办法进来抓人,而且两人还很有默契,配合得很好呢!
但是当实验进行了一亿次以后,当鬼的这组也学会搬斜坡来翻墙抓人了。
到了三亿多次实验,被抓的这组学会了先把斜坡给锁定住,然后再搭建掩蔽物。这样对方就不能翻墙抓人了。
对方都把斜坡锁住了,完全不能翻墙,理论上到这里,就算是人类玩家也会觉得已经没招了吧?
这样还能抓到人吗?!
到了四亿多次实验时,当鬼的AI居然发现了一个bug,就是把方块推到被锁定的斜坡旁边,然后顺着斜坡走上方块,居然就可以连着方块一起移动了。这已经完全超乎游戏设计师的想象了!
然后到了将近五亿次的时候,被抓的这组决定,在搭建掩蔽物之前,先把所有的物体都锁定住,完全不让他们搬任何东西,就可以避免刚才那种情况了。但因为游戏开始前,当鬼的这组被锁定住的时间是非常短的,所以被抓的这组就非常需要互相配合,才能够在短时间之内锁定物体,并且还要搭建掩蔽物。
这个如果你给人类玩家,如果没有一个先协调好的话,玩家之间可能都还会互抢,互撞之类的把。但AI却可以做到完美的合作,那除了刚才的那个bug以外,AI在游戏过程中还发现了各种有趣的玩法。
例如说如果没有限制场地大小的话,被抓的这组最后就会干脆直接落跑了,甚至他们还摸索出场地的漏洞,直接把斜坡那个漏洞给推出去。更扯的还有这个,当鬼的AI直接用场地漏洞把自己弹射到空中,而且落点刚好就在被抓的这组人所躲的地方。这人类玩家已经几乎不可能办到了吧!
研究人员说这个实验主要是测试所谓的Multi-Agent Competition ,也就是让AI之间用竞争的方式来学习,看看会不会比只有一组AI,然后给他一个单纯的动机这样子还要更有效。
他们相信,用竞争学习的方式,可以让AI更有效地学习与场景中的物体互动的能力,能发展出类似人类的行动策略,甚至打破规则,发展出连人类都意想不到的策略。
如此看来,以后AI超越人类玩家的优势实在太大了,像小编这种菜鸟恐怕以后连游戏都没的玩了。
对此各位同学有什么想法呢?欢迎评论区留言!喜欢的话可以点击关注。
Copyright © 2024 妖气游戏网 www.17u1u.com All Rights Reserved