昆仑万维「天工SkyAgents」Beta版全网测试（昆仑万维传奇）

12月25日，昆仑万维AI Agents开发平台「天工SkyAgents」Beta版正式开放测试，用户可在https://model-platform.tiangong.cn/立即体验。

昆仑万维「天工SkyAgents」AI Agents开发平台，基于昆仑万维「天工大模型」打造，具备从感知到决策，从决策到执行的自主学习和独立思考能力。用户可以通过自然语言构建自己的单个或多个“私人助理”，并能将不同任务模块化，通过操作系统模块的方式，实现执行包括问题预设、指定回复、知识库创建与检索、意图识别、文本提取、http请求等任务。

在大模型技术高速发展、AI Agents应用不断进步的当下，昆仑万维「天工SkyAgents」是我们在智能体领域的一次探索与尝试。这个平台也许并不完美，但我们希望与广大开发者们携手共建、互助成长，不断开拓人工智能技术的应用边界。现在不完美是为了未来的完美，我们一直在技术追求的过程中，坚信而勇于突破。

携手探索，合作共创

大模型时代，交互式AI有望成为未来大模型技术的主流落地方向。历史告诉我们，新兴事物的演进总会找到一个稳定的术语来描述这种载体，而AI Agents（智能体）已经显现出了巨大潜力。

目前，全球对智能体的关注异常热烈，OpenAI高度关注智能体领域，并在OpenAI dev day发布会上发布了自定义GPTs以及Assistance API；DeepMind的联合创始人最近也提到下一代人工智能技术的发展方向将是交互式AI，而不是生成式AI。这种交互式AI很大程度上与智能体的描述是相符的，用户可以通过要求智能体完成各种任务，而智能体则可以操作软件或与人类协作，完成复杂场景的工作。

在技术范式上，昆仑万维也在不断思考驱动智能体技术快速发展的底层技术和架构。我们同时也清楚地认识到，即使在大模型的语言交互能力的加持下，我们离一个完全可以自动做决策并执行任务的智能体还有距离。

今天，昆仑万维正式开放「天工SkyAgents」Beta版，作为我们在AI Agents技术能力和应用能力上的一次探索。我们希望通过此次探索，能让越来越多的用户与开发者能够将大模型技术应用到工作生活中，打造出满足日常需求、激发灵感创新的专属AI Agents。我们也希望更多对AI Agents感兴趣的朋友们能够与我们一同携手共创。欢迎广大伙伴们提出建议与意见。

什么是AI Agents？

Agent一般译为“智能体”或“代理”，其概念最早由麻省理工学院人工智能实验室（MIT AI Lab）创始人之一Marvin Minsky在其1986年出版的《思维的社会》一书中提出。它由社会与社会行为概念被引入计算系统内，指的是在某一环境下，能持续自主地发挥作用的计算实体。

AI Agents指的则是由人工智能技术驱动，能够感知环境、进行决策和执行动作的智能实体。

AI Agents并不是一个新兴的概念，自人工智能技术学科建立以来，就陆续有围绕AI Agents的研究出现。2012年深度神经网络浪潮兴起后，有一支以强化学习训练AI Agents的学术派系诞生，轰动全球的围棋机器人AlphaGo可以看作是这一流派的研究成果。不过，此类AI Agents更适合对抗性游戏场景，在真实世界中较难落地。

然而，大模型的出现改变了这一切。

2023年，随着大模型技术在自然语言理解、工程能力、数据能力、存储能力等领域的突破，大量对话交互类“GPT”涌现，以大模型技术驱动的AI Agents在通用性、实用性、可落地性等都得到了飞速发展，在全球掀起了又一阵AI Agents热潮。

传统大模型应用大多基于Prompt（用户提示词）实现，Prompt的质量将直接影响大模型的回答效果，缺乏提示词工程能力的普通用户难以将大模型的真正能力发挥到极致。而AI Agents只需要用户给定工作目标，就可以通过独立思考、调用工具去逐步完成任务，极大降低大模型技术应用门槛。

AI Agents三大核心模块：大脑、感知、执行

根据复旦大学论文《The Rise and Potential of Large Language Model Based Agents: A Survey》，AI Agents可以划分为大脑（Brain），感知（Perception）、执行（Action）三大模块化能力。

（图片来源：《The Rise and Potential of Large Language Model Based Agents: A Survey》）

1. 大脑（Brain）

大脑是AI Agents的“核心信息处理中心”，具备理解当前环境并形成“记忆（Memory）”的能力，同时也具备存储并检索长期记忆的能力。“大脑”可以根据“记忆”和当前接收的信息进行逻辑推理，并将复杂问题拆解成可实现的子任务，应对复杂场景任务。同时，通过RAG（检索增强生成）技术，AI Agent可以根据当前场景和用户设定的目标进行进一步决策，实现独立思考、规划（Planning）和推理（Reasoning）。

2. 感知（Perception）

感知模块能够让AI Agents基于当前的环境和场景获取足够的信息，这正是其与传统RPA系统的区别之处。RPA系统在面对大量未知信息、难以预测的环境时无法进行工作，AI Agents则可以通过感知信息并做出对应的思考和行动，从而实现感知、理解和自主探索世界。

3. 执行（Action）

执行模块赋予了AI Agents执行任务的权限和能力。AI Agents在接收到用户任务指令后，结合由感知模块收集的当前场景信息，通过大脑进行总结和推理后，输出到执行模块中，使AI Agents能够根据用户需求完成指令。同时，AI Agents拥有调用、使用工具（Tool use）的能力，这些工具可以帮助Agents更高效地完成复杂任务，同时也提高了其在某些具体场景中的可信度和灵活度，相关应用场景包括让AI Agents购买飞机票、点外卖、完成企业IT/客服/法律任务等。