重塑城市：AI驱动的城市模型如何改变治理（建造城市梦想）

2023年，英伟达科学家团队将GPT-4接入Minecraft（「我的世界」）游戏，提出了全新的AI智能体Voyager。随着GPT-4不停歇地探索世界，Voyager逐渐掌握了挖掘、盖房、打猎等生存技能，同时扩充自身物品和装备，并在没有人为干预的情况下持续获得新发现。例如，如果发现自己是处于沙漠而非森林中的环境，智能体就会知道学会收集沙子和仙人掌，比学会收集铁矿更重要。

“由此展开，我们希望有个AI，通过给他设置改良、优化城市的任务，它便会根据当前的技术水平和城市状态提出适当的任务，相当于做城市体检和城市规划。”腾讯研究院资深专家、教授级高级城市规划师王鹏如是畅想AI在城市甚至是人居环境的应用场景。

王鹏认为，“城市大模型”需要基于环境反馈来完善策略，将掌握的策略与反馈记入记忆，并在类似情况下重复使用，相当于落地实施，还需要在实施过程中不断深化对城市的认知，动态地修正规划和策略；因为城市的改良，没有最好，只有更好，所以它需要持续探索城市——以自我驱动的方式寻找新的任务。

在腾讯研究院发布的《生成式AI人居领域应用趋势调研报告》中，有资深城市规划专家认为，在AI发展的早期阶段，基于规则的定量建模和专家系统，对城市规划起着关键的作用。虽然深度学习的出现带来新的可能，但它仍然与这些传统方法紧密相连。然而，并非所有任务都需要大型模型，对于特定领域而言，小型模型与本地知识库的结合可能更有效。AI在城市应用的目标，是提供针对各种场景的适当解决方案，并继续探索如何有效地结合各种工具和技术，以实现高效、经济的智能服务。

有没有可能建立一个城市大模型？城市大模型能做些什么？技术驱动将为城市治理带来什么变化？又将可能产生什么问题？基于以上问题，36氪与王鹏进行一场深入讨论。

城市大模型挑战：超越文本数据的复杂处理需求

2023年，随着通用大模型的快速发展，全世界看到了AI技术在城市治理中的潜力。王鹏认为，尽管现有的通用大模型在特定行业中应用仍有限，但它们在处理复杂系统问题上展现出了前所未有的能力。

因此，考虑发展更专业的行业大模型，如城市大模型，以支持更精细的城市管理和规划决策。这种模型可以帮助解决城市的各种问题，提升治理效率，再通过高质量数据和精调，实现真正的智能城市管理。

从具体研发角度看，截至目前，除了如生物基因蛋白质分子结构、时序时空这些特殊模态的大模型外，从零构建行业大模型没有必要，主要挑战在于算力成本。

官方数据指出，GPT-3数据集的体量为753GB，LLaMA4的为828.2GB。以1000GB的数据模型为例，这相当于需要处理超过500亿份城市总规说明书规模的文本数据，每一份说明书的字数大概是十万字。这一巨大的数据量，侧面反映了行业大模型构建时所面临的高算力成本和技术门槛。

在城市领域，一些关键的行业知识，如规划文本、政策文件、和法规规范是难以完全通过文字表达的，这些知识的复杂性超出了简单文字的范围。此外，城市领域还涉及需要通过图纸等多模态数据处理的内容，这类信息更是无法简单地转化为可直接计算的格式。因此，建立城市大模型需要处理的不仅仅是文字数据，还要涵盖多种格式和类型的复杂信息。

在训练方面，达到所谓的“智能涌现”，仍然是一个未知数。一般而言，GPT3.5、文心一言、通义千问、GLM达到“智能涌现”，背后支撑的参数规模为千亿以上。这种智能涌现是处理复杂城市系统时，极为重要的能力。

然而，大多数行业大模型的参数规模通常只有百亿级别，为了保证调优的效果、效率和性价比，这样的规模是必要的。因此，这些模型虽然名为“大模型”，但在真正的智能表现上，可能只能达到形似而非神似，难以满足通用人工智能的高级预期。

截至目前，出于经济性的考虑，使用LLM模型应用，仍难以构建商业闭环，除了需求方对技术的理解参差不齐，成本也是一个无法绕过的难题。在一落地的城市相关大模型项目中，仅30MB的文本数据，在百亿参数模型上训练一次的成本就接近万元，且训练效果不可预知，但该成本在未来下降的可能性较大。

相比研发出一个行业通用大模型，基于基础大模型的能力，进行应用开发，将成为行业大模型的“主流形态”。

不同于以往的通用大模型，城市大模型通过精准的行业数据训练，致力于解决复杂的城市问题，如公共服务优化、城市规划和治理效能提升。这个应用，关注的不是模型本身，而是具体要完成的任务，实现技术与城市需求的高度融合。

应用场景：辅助决策、敏捷治理、政务服务

王鹏认为，相比于专业人士对于“大模型”的认知，如何统一各方参与者对于“城市”的认知，是更难的事。他认为，无论是面对信息技术厂商、人工智能技术专家，甚至是面对城市政府，这些角色脑子里的“城市”，都不是规划师脑子里的“城市”。

如果以商业闭环的逻辑开发城市大模型，较为合理地是应用于公共服务与公共管理领域，其背后资助方是地方政府。王鹏坦言：“虽然大模型技术好像很高大上，但相比之下，现有应用一点都不科幻，请做好心理准备，现实就是骨感的。”

截至目前，城市大模型的应用场景有几类，包括辅助决策、敏捷治理、政务服务等。

在辅助决策方面，大模型可以通过提供数据分析、案例对比等方式，帮助决策者进行更全面和迅速的决策。例如，通过整合城市数据库，大模型可以实时回答领导的各种查询，增强决策的信息支持。

近年来，城市大脑、产业大脑等信息化项目，在一定程度上完成了一些城市数据的汇聚。因此，目前最易落地的应用场景，就是整理汇聚数据库，用大模型能力进行基于语义交互的、灵活生成的数据分析，可以实现领导随心问，大模型即时答。一定程度上是对上一代“领导驾驶舱”的升级。

王鹏表示：“AI负责全面正确，人类负责作出艰难的选择，是决策过程中AI与人类分工的理想界面。”

敏捷治理方面，是利用大模型快速响应公众需求，改进传统的政府运作模式。这包括快速识别市民问题，自动化处理反馈，以及优化政策执行过程。

类似纽约市政热线311、北京市民服务热线12345——从源头上快速回应需求，对于这些问题与诉求的广泛采集与快速回应，大模型技术可以很好地提供支持，包括对问题诉求的快速识别、总结提炼、派单分发、基于过往案例经验、法规条例的处置建议。该功能同样需要一定知识输入，也可能涉及多模态大模型。

政务服务方面，大模型通过智能问答系统，提供政策咨询和办事指南。相比于辅助决策、敏捷治理，政府服务可以理解为G to C服务的属性，大众更容易感知。各级政府、各相关部门及事业单位，根据法律法规，为社会团体、企事业单位和个人提供的许可、确认、裁决、奖励、处罚等行政服务。政务服务线上平台，通过打通不同部门的信息系统，打通线上线下服务，减少烦琐的手续和流程，让群众、企业更快速地办理各种事务，提高行政服务效率。

以上各场景均显示了大模型在城市管理中的潜力，但同时也需要大量的数据输入、高水平的技术支持和持续的优化才能实现最佳效果。

城市大模型的构建和应用，虽然面临诸多挑战，如数据整合、模型训练的高成本和技术门槛，但其潜在的优势和长远的应用前景是显而易见的。在未来，这些模型不仅可能在单一城市中发挥作用，更有可能在全球范围内被复制和推广，成为城市发展和管理的新常态。

通过深化行业知识的应用和技术的不断优化，城市大模型预计将引领一个更加智能和高效的城市治理新时代。

当然，相对于建立完整城市大模型的长远目标，生成式 AI近期在人居领域已经有很多的应用。《生成式AI人居领域应用趋势调研报告》中就涉及了关于规划、建设、运营等环节的多个应用。

在腾讯正在建设的前海总部，正打造一个“人、机、环境全面友好的未来城市原型，这里将集聚一系列数字科技领域的创新实验室群及相关设施，包括以机器人、人工智能、音视频、未来网络、未来出行、碳中和等为主题的多座建筑，为企业的科学家和工程师提供集办公、研发、测试、发布、交流为一体的创新空间。同时也发起了未来城市AI创意设计大赛，面向公众征集更富想象力的设计。用生成式 AI，帮助所有普通人表达对未来的想象。

36氪作者｜宋虹姗