五角大楼使用聊天机器人来控制《星际争霸 II》中的战斗行动（星际行动手游）

美国军方在基于计算机策略游戏《星际争霸 II》的军事模拟器的背景下，探索了聊天机器人在战斗规划中的使用。他们基于 OpenAI 的大型语言模型开发了一种新的聊天机器人，并将其与普通用户可用的其他聊天机器人进行了比较。军方很高兴，专家警告说，如果这些技术在现实中使用，将会产生不愉快的后果。这些后果包括重大的“计划”损失。

美国军方长期以来一直在探索在军事行动中使用人工智能技术的潜力。例如，他们使用人工智能来分析战场图像，甚至识别空袭目标。但直到最近，五角大楼才开始测试所谓的大型语言模型和基于它们的聊天机器人，据一些专家称，这将有助于指挥官快速适应战场上不断变化的情况，并在几秒钟内做出正确的决定。

我们来解释一下：大语言模型是先进的人工智能模型，它使用机器学习算法根据大量文本数据来概括、预测和生成人类语言。

聊天机器人是一种计算机程序，它模拟与用户的真实对话，并使用文本、图形或音频消息与他进行通信。由于聊天机器人使用语言模型，因此它们理解语言，而不仅仅是命令。因此，每次对话后他们都会变得更聪明。

美国陆军研究实验室的科学家谈到了一款基于OpenAI大语言模型的新型聊天机器人COA-GPT，该机器人是专门为帮助指挥官而创建的。为了测试虚拟助手的有效性，研究人员将其与普通用户可用的其他聊天机器人进行了比较：GPT-4 Turbo和GPT-4 Vision（也基于OpenAI，后者可以处理文本和图形信息）以及另外两个聊天机器人-基于旧语言模型的机器人。工作成果发布在预印本电子档案馆arXiv网站上。

该实验在基于即时战略电脑游戏《星际争霸 II》的军事模拟器中进行。所有“测试对象”都扮演了军事顾问的角色，他们必须策划并实施虎爪行动（TigerClaw）。

军方为聊天机器人设定了多项任务。首先，向指挥官（由人类扮演）提供有关行动发生地的地形信息，以及有关盟军和敌军的详细信息。之后，虚拟助手需要将特遣部队从河西岸转移到东岸，以最小的损失跨过四座桥梁，占领敌方目标并消灭敌人。

模拟战斗地图。箭头表示打击方向，需要捕获的目标用黑色圈出

游戏中的单位被用作真实军事装备的原型。例如， M1A2艾布拉姆斯坦克被攻城坦克取代，机械化步兵则被地狱车取代。盟军由九辆坦克、三支摩托化步兵、一支迫击炮部队、两支航空部队和一支侦察部队组成。敌军由12支摩托化步兵部队、1支航空部队、2支炮兵部队、1支反坦克部队和1支步兵部队组成。

所有五个聊天机器人在任务期间都以闪电般的速度（实际上是在几秒钟内）做出了决定。然而，与基于旧语言模型的聊天机器人相比，基于OpenAI大型语言模型构建的聊天机器人为实现目标提供了更多选择。但在执行任务时，前者牺牲装备和人力的情况比后者要多得多。也就是说，GPT 聊天机器人比它们的“老伙伴”遭受了更多的军事损失。

至于COA-GPT，它比其他聊天机器人更成功地能够适应任务期间出现的新情况，而无需重新训练，并且在与人类指挥官的交互中也表现出更好的结果。