文|胜马财经武可
编辑|欧阳文
在经历过“宫斗”的俗套剧情没多久,OpenAI放出了一个“王炸”——Sora。
这一文生视频新型模型以其卓越的技术突破,引起了业内广泛关注,不仅在技术层面上大幅刷新了行业标杆,而且重新定义了AI文本生成在视频领域的技术极限,给2024年开年后的AI生成世界带来了一场震撼秀。
360创始人周鸿祎评价Sora时说道,“它看起来是个文生视频的工具,但实际上是AGI的第二个突破点,是解决人工智能对这个世界的观察、交互、认知,以及建立常识的重要里程碑。”
胜马财经注意到,Sora最引人注目的技术突破之一是视频时长的显著提升。能够生成长达1分钟的视频,这远超过市面上其他AI视频模型。通过简单的文本指令,Sora可以直接输出细致入微的、具有复杂多角度镜头和富有情感的一整分钟视频。
而视频中动画和人物动作的逼真程度,被业内人士视作人工智能对于人类所处的物理世界理解程度的真实反映,而Sora除了在更长维度上的独特价值外,作为一种高效工具的它,也将会给诸多行业带来彻底的颠覆。
01“王炸”Sora
根据OpenAI官网介绍,“Sora是通过一次性为模型提供多帧的预测,我们解决了一个具有挑战性的问题。我们正在教AI理解和模拟运动中的物理世界,目标是训练模型来帮助人们解决需要现实世界交互的问题。”
其核心技术基于Transformer架构,建立在DALL·E3和GPT模型之上,将视频生成的时长一次性提升15倍,颠覆了市面上所有短视频的时长要求。
一个显著的创新是Sora带有世界模型的特质,即对真实的物理世界进行建模,使其对世界有一个全面而准确的认知。这不仅使得AI视频生成更流畅、更符合逻辑,降低了视频模型的训练成本,还提升了训练效率。例如,在视频中添加逼近真实的倾斜和颠簸感,Sora的世界模型已经展现出了惊人的能力。
在核心应用方面,Sora不仅可以通过文本生成视频,而且可以以静态图片生成视频,甚至连接两个完全不同主题和场景的视频,实现无缝过渡。这种多模态数据的通才性质,让人惊叹不已。
有人这样解释Sora的原理:想象一下你有一堆照片,有的拍摄自山川,有的是城市风光,还有一些是海滩日落。每张照片都有不同的尺寸、分辨率和风格。这就像是一堆杂乱的拼图,每个拼图都有独特的景色和细节。然而,你希望用一种更方便处理和存储的方式来管理这些照片。
这时候,Sora就像是一位技术高手,使用一种叫做“视频压缩网络”的技术,将这些各式各样的照片进行处理。类似于把所有拼图调整成相同的大小和形状,这样它们更容易被组织和处理。但重要的是,这并不是要忽略每张照片独特的景色,而是把它们转换成一种Sora更容易理解和处理的格式。
接下来,Sora将这些经过处理的照片进一步拆分成所谓的“空间时间补丁”。这些补丁可以看作是照片的基本构建块,就像是一张相册中的每一张照片都可以分解成包含独特景观、颜色和纹理的小片段。这样,无论原始照片的长度、分辨率或风格如何,Sora都可以把它们处理成一种统一的内部表示形式。
通过这种巧妙的处理方式,Sora在保留原始照片丰富信息的同时,成功地将不同来源和风格的视觉数据整合成一种可操作的内部形式。就好比当你查看一本包含各种各样世界名胜的相册时,尽管照片各异,但你依然可以通过相同的方式去理解和欣赏它们。
02Sora将对哪些行业带来颠覆?
毋庸置疑的是,Sora的出现将对多个行业产生深远影响。从短视频行业、影视行业、游戏行业,到广告、教育、电商、科研、建筑等领域,都将因其强大的生成能力而发生巨变。
对广告业、电影预告片和短视频行业,Sora可能会减少对真人演员和导演的依赖,降低制作成本。在教育领域,Sora可以用于创建生动有趣的教育视频,提供更加互动的学习体验。同时,Sora还可能改变视频制作、剪辑、动画设计等职业的工作方式,带来新的职业机会。
在胜马财经看来,于国内商业现状而言,Sora的出现最有可能对一些广告宣传、人物出镜、视频预处理和初级剪辑等工作环节的人带来挑战,比如说,在电商行业,产品宣传视频对于促进销售至关重要。Sora的生成能力可能在一些标准化的产品宣传视频制作中替代部分工作,减少对专业制作人员的需求。
而在更有价值的科研领域,Sora的视频生成技术可能被应用于模拟实验过程,帮助科研人员可视化实验结果。这有助于简化一些复杂实验的展示和解释。
当然了,随着Sora技术的进步,它未来在内容真实性、版权、隐私和数据安全方面,尤其是考虑到世界各国各地区法律法规的不同,Sora生成的视频可能引发一系列道德和法律问题。如何确保AI生成的内容不侵犯他人权益,不传播虚假信息,将是一个亟待解决的问题。
但总体而言,Sora的出现标志着人工智能领域又迈出了一大步。它既是对现有技术的颠覆性挑战,也是对我们思考人工智能在未来发展方向上的重要启示。
03哪些机会可以把握?
在给一些行业带来挑战和颠覆的同时,Sora也给更多行业带来了更多的机遇,而在资本市场上,相应的Sora概念股和潜在受益上市公司也着实火了一把。
据有关媒体统计,包括岭南股份、名臣健康、因赛集团、首都在线、中科信息、萤石网络、凌云光、芒果超媒、华是科技、东港股份、实丰文化、世纪天鸿、天创时尚、创源股份、巨人网络、会畅通讯、千方科技、北信源、智微智能和掌阅科技在内的20家上市公司近两日在互动平台回复Sora相关情况。
其中,北信源表示,公司与OpenAI已对接完成文生图的技术研究工作,Sora(文生视频)是OpenAI最新发布的技术,目前公司正在做技术相关方面对接和研究;当虹科技表示,文生视频技术已取得一定进展,在生成视频时长和效果方面,还在逐渐突破。另有多家上市公司回应称,Sora相关产品和应用处于初级阶段,有待进一步研究,将根据自身业务特点,在文生视频技术落地、Sora应用等方面寻找突破入口。
广发证券研报提出,在互联网&视频方面,Sora或更快带来短视频内容生产体系变革,长视频生产模式短期较难被颠覆,但有机会加速生产效率。例如Sora初步具备生产1分钟内容能力,并可以剪辑多个视频,有望逐步替代部分人工创作;或迭代出新的商业模式,如电商、广告等业态的智能化内容生成替代,或加速短视频平台、商家、MCN的变现效率。
而在长视频领域,Sora短期赋能PGC创意生成、提高内容分发效率和降低内容宣发成本;长视频仍需较长故事线支撑和艺术家审美赋能,在真人出演类型中的应用可能较为有限,但对科幻、动画片等的生产提效或更为明确。
而更易理解的当属动画、特效占比高的内容公司,Sora强化文生视频能力,关注买量素材降本;长期有望提升游戏生产效率、内容丰富度并增强用户体验,进一步提升用户付费意愿。关注具备较强发行能力的游戏公司。
然而,在讨论Sora所带来的热潮中,我们也看到了一系列商业行为和炒作,例如近期涌现出各类Sora相关的付费课程和服务。这一现象引起了社会各界的关注和讨论。
必须提醒,目前Sora还在内测阶段,尚未对外开放使用。但在不少社交平台和短视频平台上,一些个人和机构在尚未使用Sora的情况下就推出相关的付费课程,在这其中,李一舟成为国内AI课程领域的“明星”,推出的AI课程吸引了大量学员。然而,也有一些质疑声音认为这些商业课程可能在“割韭菜”、收“智商税”。
胜马财经认为,Sora的出现确实为科技、娱乐和教育等领域带来了新的机遇,但在商业推广中也引发了一系列问题。Sora的大规模应用可能创造新的职业机会,提高效率,但需要警惕商业行为中的不规范和炒作。在Sora面向大众开放后,相关付费课程和服务可能会越来越多,这也需要对行业进行规范和监管,以确保大模型行业的良性发展。