Sora会不会成为世界模型模拟器?
Sora会不会发展成世界模型的模拟器?上期讲到AI的迅猛发展极有可能会出现超级数字智能物种,AI能不能模拟这个世界?本期秘影解谜者将和大家聊聊Sora和世界模型的关系。
最近OPEN AI推出一款视频生成软件Sora,一时间风头无两,总结起来就是"60秒超长长度"、"超强语义理解"、"世界模型"。
什么是世界模型?看下ChatGPT/百度文心一言的回答。ChatGPT的回答是:世界模型是指人类大脑中对外部世界的一种内在表示,它是由感官输入、记忆和推理等多种因素共同构成的,可以帮助理解和预测周围环境中的事物和事件。
世界模型是对外部世界的认知和理解的基础,它不断地被更新和改进,以适应不断变化的环境和经验。在人工智能领域,研究人员也在努力构建机器人的世界模型,以帮助机器人更好地理解和适应环境。
文心一言回答是:世界模型是一种内在表示,它可以是人类大脑对外部世界的理解和认知,也可以是人工智能系统对环境的模拟和预测。它通过对环境中的信息进行处理和整合,形成对环境的一种抽象和概括,从而帮助更好地理解和应对环境中的变化和挑战。
简单来说世界模型是一个"编码器"-推理中枢-解码器结构,其中编码器负责处理真实世界的各种输入。如佛家所说人有六识,所谓色、声、香、味、触、法。这里的"法"指意识规则,可以用文字来代替,因为文字就是人类进行思想交流最重要媒介。
目前还很少有人用一个统一的编码器对它们进行编码,而是采用每个模态都有各自独立的编码器,就如同人的眼、耳、鼻、舌、身、意。当然除了人类的六识以外还存在着"超"人的状态,比如电磁波、超声波等等。
Sora的"编码器"-推理中枢-解码器有多厉害?通过大量数据的学习,Sora竟然学会了很多关于物理世界的规律。以下面的这个片段为例:prompt中描绘了一个短毛绒怪物跪在一支红蜡烛旁的动画场景,同时描述了怪物的动作和视频的氛围。
随后Sora就创造了一个类似皮克斯作品的生物,它似乎融合了FurbyGremlin和《怪兽公司》中Sully的DNA。让人震惊的是Sora对于毛发纹理物理特性的理解准确得令人惊掉下巴!
想当初在《怪兽公司》上映时,皮克斯为了创造出怪物在移动时超级复杂的毛发纹理,可是费了好大一番功夫技术团队直接爆肝几个月,而Sora不费吹灰之力就实现了!这让人不禁惊叹如果Sora在迭代几个版本,会不会我们就分不出虚拟和现实的边界吗?
各位老铁你们觉得Sora会成为世界模拟器吗?请把你们的评论打在公屏上我们一起讨论下。本期视频就到这里感谢观看和支持!
Copyright © 2024 妖气游戏网 www.17u1u.com All Rights Reserved