开发人员通过将人工智能技术运用到街机弹球机上,目前可以在四天内击败人类玩家。
杰克·斯金纳(Jack Skinner)在本周即将举行的微软开发人员大会上发表讲话时,描述了他和悉尼开发团队如何使用人工智能来控制实际的弹球机。
该团队使用一台常规的街机游戏机进行了改装,使用一台Windows计算机控制AI软件,并使用Raspberry Pi控制弹球机内的鳍状肢机构。在弹球机上安装了两个摄像头,一个指向记分牌,另一个指向桌子-这样,AI可以像人类玩家一样“看到”桌子。光学字符识别(OCR)软件允许计算机从弹球机的电子显示屏读取当前得分。
在没有以前可用的模型的情况下,必须教AI如何从头开始弹弹球。刚开始,这台机器“没有任何真正的理由随机击中鳍状肢,那是因为它仍在发现董事会的运作方式,” 斯金纳告诉与会者。
为了增强技能,团队使用了强化学习算法,迫使团队“像小狗一样对待它”。
斯金纳说:“我们需要适当地训练它,这意味着当它取得好成绩时我们会给予激励或积极的指标,而在没有得到好成绩时会给予负面的反馈。”
“随着时间的流逝,机器学习模型会学习是否赋予它高分的东西,或者不赋予它高分的东西。因此,虽然我们不处理有感觉的人工智能,但我们要处理的是一个模型,该模型已了解游戏中的模式,并且可以学习重用这些模式来尝试并获得高分。”
机器很快就掌握了游戏的窍门。“在一天的时间里,它从随机击中鳍状肢到开始得分。两三天后,我们开始看到它获得了一些高分。四天后,我们开始看到它试图获得一些技巧,并开始与人类对抗。”
打破障碍
但是,在创建AI弹球玩家的过程中遇到了一些障碍。斯金纳讲述了一个事件,该团队将机器设置为连续玩一整夜以继续学习,但它损坏了一只脚蹼。当然,因为是在凌晨2点,并没有人注意到。虽然在启动12小时后返回了,但还是要提醒用户在构建AI和ML(机器学习)时输入数据的重要性,必须认真考虑输入数据和输出模型的偏差。
,