
近日,OpenAI再向世界扔了一枚AI炸弹——视频生成模型Sora。这个让央视都点名的Sora,也被认为是通用人工智能的又一个里程碑。Sora的究竟有多厉害,为什么众多AI视频从业者,一夜之间纷纷都说“马上下岗”了呢?
Sora,OpenAI最新推出的文本转视频模型,能够仅凭用户输入的提示词、文本指令或静态图像,生成高达一分钟的视频内容,且视觉质量绝佳。这些视频不仅展现了精细的场景复现,还有生动的角色表情和复杂的镜头动态。
我们可以简单地把Sora的惊艳之处总结成两方面。一方面,Sora可以说创建了一个“世界模拟器”。与传统的动态补帧技术不同,Sora是首款能够深刻理解现实世界并将其转化为视频内容的AI。这种对现实世界的高度理解和表达能力,是Sora独有的特色。根据OpenAI官网发布的48个视频演示,Sora不仅在细节呈现上极为准确,还能创造出富有情感的角色、特定风格的活动,并精确再现主题背景下的复杂场景。
比如,在一段行驶的列车视频里,Sora不仅精准还原车内外的场景变化,还巧妙地处理了玻璃反光和光影明暗,达到了接近完美的效果。
另一方面,Sora所生成视频的时长是60秒,这在业内看来也是一个极大的飞跃。这一增加的时长不单是算力上的胜出,更是表明了Sora在理解用户提供的语义内容方面的自主性和创造力,使其能够创作出更长的视频来深入解读和表现既定的主题。而且这一时长使得其在实际应用上的范围也更加广泛。
想象一下,你是一个从事户外婚纱摄影的摄影师,目标是创造一部短片,来激发大家的购买欲望。按照传统的制作流程,需要安排演员和摄制团队环球旅行,逐一在风景名胜进行实地拍摄。然而,有了Sora,只需输入一条指令,Sora就能为您生成一部堪比实地拍摄的精美广告短片,既节约了时间也减少了成本,不满意还可以继续调整。
我们可以发挥想象,sora在实际应用中的涉猎将非常广泛。虽然目前Sora并未进行公测,但仅仅通过放出的预告片,我们就可以分析出其落地的那一天对于视界行业的影响。它将直接导致视频制作变得更加低成本和高效率,但同时也会对从事视频制作的专业人士,如导演、摄影师、剪辑师和视觉效果的职业造成直接挑战。
头图来源:图虫