在人工智能领域,OpenAI的最新成果Sora视频生成模型正引发全球范围内的广泛关注。这款模型不仅能够实现视频内容的一致性和动作连贯性,而且在流畅度上相较于之前的预览版有了显著提升。
OpenAI的首席执行官萨姆·奥尔特曼(Sam Altman)对Sora寄予厚望。他强调,视频对OpenAI至关重要,并分享了三个关键点:首先,OpenAI致力于为创作者打造工具,这种创造文化对他们来说至关重要,也是他们希望人类利用AI的方式之一。在早期的测试中,他们观察到了一种新型的协作创作动态,这不仅有趣,而且显示了AI创意工具的潜在使用模式;其次,奥尔特曼表示,他们不希望这个世界只是科技的堆砌。如果AI系统主要通过文本与人互动,那么他们可能会错过一些重要的东西。他们希望AI能够理解并生成视频,这将深刻改变人们使用计算机的方式;最后,他提到,这对OpenAI的通用人工智能(AGI)路线图至关重要。视频将成为一个重要的环境,人类或AI将在这里学习到很多关于如何实现所需目标的知识。
然而,Sora的发布在国内引发了不同的看法。一些AI行业人士认为,这是改变AI视频生成领域的新契机。但也有专家坦言,OpenAI已经占据了先机,对国产AI视频生成行业来说可能是一场挑战。
事实上,自Sora预览版发布以来,全球AI视频创业热潮已经持续了300多天。国外多家公司,如Runway、Pika、HeyGen都曾声称可以超越Sora。同时,国内的互联网科技巨头,如字节跳动、快手、阿里、腾讯等也纷纷公布了AI视频产品,使用者数量庞大。一些AI视频初创公司,如智谱、生数、爱诗科技等,已经开始从产品转向商业化。
AI短剧导演陈坤曾透露,AI使得制作周期从通常的3-6个月缩短到了2个月,成本也降到了传统制作流程的1/4以下。生数科技的联合创始人、CEO唐家渝也表示,他们追赶Sora的信心非常足,今年一定能达到Sora目前版本的效果。
随着Sora的发布,全球掀起了一场关于AI视频生成的讨论风暴。大量AI公司以做“中国版Sora”为目标,众多企业、教授、互联网大厂都参与其中。清华大学计算机科学与技术系的朱军教授、生数科技的创始人兼首席科学家,以及曾任字节跳动AI Lab总监的王长虎等人都已进入这个赛道。
红杉资本在2023年发布的一篇关于生成式AI发展进程的预测报告中指出,视频方向将是AI领域需要重点关注的方向之一。因为视频杂糅了文本、语音、图像等多维度内容,有更多的想象空间。
生成式AI视频生成通过计算机视觉、机器学习等多种AI技术手段,实现了视频内容生成过程的自动化。无论是文生视频、图生视频还是视频生视频,AI驱动的视频生成工具的使用不断增加,为影视、游戏、培训与教育、营销与广告、社交媒体等领域的发展提供了更多增长空间。
据数据显示,2024年全球AI视频生成市场规模预计达6.148亿美元,预计到2032年,整个市场规模将超过180亿元。早在Sora发布之前,就已经有多家海外公司迅速公布了AI视频生成和多模态技术产品。随着Sora的爆火,AI+视频技术和产品正在迅猛升级迭代。
在国内,AI视频生成的参与方主要分为三类:初创公司、互联网科技龙头和央国企搭建的AI研究院。其中,初创公司如智谱、生数科技、爱诗科技等都已经从技术迭代转向了商业化变现。而快手、腾讯、阿里等互联网科技龙头也已逐步为C端提供服务。
商业化层面,AI视频生成提供To C端和To B端服务。不少AI产品已经开始进军海外,并推出了较为完备的会员付费体系。以爱诗科技为例,其主要售卖长达5秒的PixVerse版本,价格低至每次调用API 0.75元/张,一次生成5张,也就是3.75元。
然而,由于技术尚未足够成熟,目前市面上的文生视频模型仍存在一些缺陷。例如,生成视频在画质、细节、真实感等方面仍与真实视频存在差距。国内AI视频生成产业链依然不成熟,面临算力稀缺、数据需要多轮训练等情况。
尽管如此,仍有一家国内AI视频生成公司从去年成立起,就已经从企业客户处获得了4000万元的收入。今年,该公司预计销售收入将超过1亿元,原因是他们盯上了一块更大的蛋糕:AI短剧市场。短剧近年来大火,市场规模持续增长,已经顶得上电影票房的七成。
随着Sora Turbo的发展,AI视频生成这一新兴市场的竞争将更为激烈。留给“中国版Sora”们赶超的时间真的不多了。