继ChatGPT之后,OpenAI又推出一款震惊科技圈的产品—Sora!今天就带大家一起深入了解一下它!
01、什么是Sora?
Sora是OpenAI首个视频生成模型,通过文本指令,它可以直接输出长达60秒的视频,并且包含高度细致的背景、复杂的多角度镜头,以及富有情感的多个角色,出道即王炸!
Sora建立在过去对DALL·E和GPT模型的研究之上。它使用DALL·E 3的重述提示词技术,为视觉训练数据生成高度描述性的标注,因此能够更忠实地遵循用户的文本指令。
02、Sora有何颠覆之处?
- 生成视频的时间长度。在Sora之前,受制于AI文本到视频生成的物理和时空推理局限,目前整个行业中所公布的单个连贯性视频的最大长度是16秒,行业的普遍水平是2-4秒之间。但此次Sora的最大支持长度是60秒,直接跨越式升级15倍。
- 镜头切换与画面流畅度。此前AI生成视频产品都是单镜头单生成,在效果层面更像是让一张图片动起来。但由Sora所生成的视频,能够在保持主体一致性的前提下实现多角度镜头无缝切换,整个画面干净流畅,从而实现真正的视频大片效果。
- 使用的基础模型架构。此前的AI生成视频大部分都是基于“大模型 大数据”架构,因此难以突破AI幻觉问题,Runway也在去年12月正式提出要打造通用世界模型。但此次Sora则已经具有了世界模型的雏形,其生成的视频是基于对真实物理世界的理解,因此内容更加符合逻辑也更加令人信服。
一起来看一些官方放出的视频,感受一下Sora的魅力!
· 提示:雪后的东京熙熙攘攘。镜头穿过繁忙的街道,跟随着几位享受着美丽雪景和在附近摊位购物的人们。美丽的樱花瓣伴随着雪花在风中飘舞。
· 提示:一段海上自行车比赛的视频,让各种动物作为运动员骑自行车,采用无人机拍摄视角。
· 提示:一名祖母辈的网红主持的自制团子烹饪课程,背景是一个质朴的托斯卡纳乡村厨房,并配有电影级的灯光。
03、目前可以试用吗?
目前sora还未对公众开放,只有非常少量的测试账号提供给专业人士,门槛非常高。但也有比较简单的测试方式,小编推荐感兴趣的小伙伴参考官方实例,写好视频提示词,打开某推,去@openAI创始人Sam Altman,等待回复就可以啦~