这个赛道各种弯,仅仅15代的神经进化,不喂任何人类数据的AI跑车就跑动了全赛道。
我们构建了这样一个神经网络,作为汽车的大脑,激光雷达获得前方5个方向的距离信息,2个当前车速信息,实时获取的这七个数据。作为神经网络的输入层,全连接进入隐藏层,输出层4个数据,去驱动汽车,分别对应的就是玩赛车游戏的时候的四个键:左拐、右拐、油门和刹车。
通过模拟生物进化的遗传算法来进化汽车脑,依然是撞墙就销毁,重置"大脑",前进就给予奖励。每代500条"命"一分别对应500个神经网络模型,消耗完选拔50个大脑进入下一世代。
选拔标准是什么?从消耗的500条"命"中拿出15个获得奖励最高的,直接进入下一代。这模拟的就是自然选择适者生存,然后拿出排名前425个大脑,随机出45个大脑,进行随机突变,也就是神经网络对应参数组合的随机微调。然后将这45个突变大脑与15个精英大脑组合为新的一个世代,开始下一轮的进化与突变。
如此循环,仅仅15代的进化,7500次的"死亡",就进化出了能通关的神经网络模型,数字矩阵。以下记录的是第一次跑完全赛道的过程,虽然颤颤巍巍,虽然操作路线不是最优的,但是随着训练的死去,会越来越稳健,并开始追求最快速度完成。
以下是整个神经进化的全程,请欣赏"上帝视角",感受下进化的力量。
Copyright © 2024 妖气游戏网 www.17u1u.com All Rights Reserved