当Sora植入自动驾驶，会触发哪些反应？（未来汽车驾驶模拟器）

近日，国外社交媒体流出一段OpenAI CEO Sam Altman及COO Brad Lightcap 一同接受采访的视频，两人直接给出了“高质量AI技术成本有可能降到‘接近零’”的观点，并提出，通过 ChatGPT 等AI技术，企业供应链在特定领域可大幅压缩支出，节约成本。

在ChatGPT之外，今年年初正式推出的文生视频应用Sora是OpenAI扔向市场的又一“王炸”，至今热度不减。那么，在AI的天然应用场景——自动驾驶中，Sora有没有用武之地？能否成为汽车智能化中的新亮点，带来新的用户体验？新的AI产品在自动驾驶场景下，如何改变汽车供应链成本结构？我们与自动驾驶方案解决公司的技术人员聊了聊，与大家分享如下观点：

Sora在自动驾驶中最有可能的应用方向

OpenAI表示，Sora能深刻理解语言，不仅理解用户文本提示，还能理解所属事物在物理世界中的存在方式。“我们正在教授人工智能理解和模拟运动中的物理世界，目标是训练模型帮助人们解决需要与现实世界交互的问题。”

换句话说，OpenAI对Sora的定义不只是替代视频生成的创作者，而是将视频生成作为帮助AI理解真实世界的「模拟器」。

因此，Sora的应用将不仅仅在视频制作领域。视频制作之外，最先受到关注的可应用领域当属自动驾驶。

从根本上来看，Sora最创新之处还是在对物理世界的理解上，以此为基础，Sora在自动驾驶技术中或许会有广泛应用空间，我们大胆预测，以下三方面或许最先落地应用：

为自动驾驶测试提供更丰富的虚拟数据。自动驾驶系统的学习需要海量数据来喂养，而目前受限于车队规模、量产上车数量及实际使用率等现实问题，自动驾驶数据采集仍存在较大缺口。Sora的视频生成能力，则恰好可以根据文字指令为自动驾驶提供源源不断的数据供给。
应用于仿真系统。简单来说就是通过sora生成一段仿真视频，模拟真实的物理世界，把自动驾驶车辆放到这个环境中去运行、测试。
用于预测决策模块。如上文所述，sora最令人惊艳的不是生成视频的能力，而是其作为「世界模型」预测物理世界变化的能力，而这一能力恰好适用于自动驾驶的预测及决策模块。在自动驾驶的预测模块，会有很多对环境变化的假设，即假设车辆发生某一变化（例如变道、加速等等）后，环境会发生什么样的变化，这恰好使用了sora的预测能力。而这一预测模型可以实现的话，sora模型则有可能进一步应用到规控当中。

Sora在自动驾驶应用中的几点壁垒

虽兴奋于Sora给自动驾驶带来的新的可能性，但理想的实现仍需要跨越很多现实的鸿沟。Sora要想真正地、更广泛地应用于自动驾驶仍要解决很多的技术难题。

首先，从OpenAI释放的信息来看，Sora目前仅能生成最长60秒的视频，但自动驾驶所需的虚拟数据、仿真环境都是持续往前延伸的，时长远超60秒。因此，延长视频时间将是Sora应用于自动驾驶需要解决的基础问题。

其次，Sora生成的世界模拟空间是以像素为表达方式的，但自动驾驶系统所需要的数据是结构化的，即如何将视频的像素表达转变为结构化表达将是Sora广泛应用于自动驾驶的重要壁垒。

最后，与视频制作等应用场景不同，自动驾驶系统的大部分计算是在车端完成的，而车端算力受制于成本、功耗等因素，算力空间有限。加之自动驾驶系统需要实时采集海量数据及低时延需求之下，计算量更是激增，这对Sora在自动驾驶中应用的算力需求提出了新的要求。

此外，Sora在自动驾驶中的应用还需要产业配套的发展支撑。从产业链条来看，Sora是基础研究，而自动驾驶则是工程化应用，其中仍需中间平台或企业完成产业链两端的链接，从而实现Sora在自动驾驶中的高效、广泛应用。

然而，上述一切均基于Sora能够100%理解物理世界。因此，客观来看，从Sora自身能力到与自动驾驶的深度融合均存在极大提升空间。

查看全文