OpenAI近日正式推出了其视频生成工具Sora的订阅服务,为用户提供了不同层次的创作体验。通过ChatGPT Plus订阅,用户可以享受到生成最多50个优先视频的服务,这些视频的分辨率最高可达720p,时长限制为5秒。而ChatGPT Pro订阅则更为强大,每月200美元的费用让用户可以无限制地生成内容,优先视频数量增至500个,分辨率也提升至1080p,时长更是延长至20秒。
对于更追求专业品质的订阅者,Pro套餐还提供了下载无水印视频的功能,并允许同时进行最多五次视频生成。这一系列的升级无疑为创作者提供了更多元化和高质量的创作工具。
Sora的首次亮相是在今年2月,作为OpenAI文本转视频AI模型,它一经推出就引起了广泛关注。在最近的直播中,OpenAI展示了Sora的新探索页面,页面上展示了由社区成员制作的AI生成视频。其中,故事板功能尤为引人注目,它允许用户根据一系列提示生成连贯的视频,还有将静态照片转换为动态视频的功能。
OpenAI还介绍了一个混音工具,用户可以通过文本提示来调整Sora的输出效果,以及一种创新的场景混合技术。然而,为了保护原创内容和避免虚假信息的传播,所有由Sora生成的视频都会带有可见的水印和C2PA元数据,以明确标识其AI制作的身份。
在上传图像或视频之前,用户需要同意一项协议,承诺不上传包含未成年人、露骨或暴力内容以及受版权保护的材料。OpenAI强调,滥用媒体上传功能可能会导致账户被禁止或暂停。OpenAI研究副总裁Aditya Ramesh在直播中表示,公司面临着在创造性表达与非法活动之间取得平衡的巨大压力,并承认这将是一个持续的挑战。
OpenAI首席执行官Sam Altman在直播声明中强调:“我们不希望世界只有文字。视频对我们的文化非常重要。”他透露,虽然Sora今天将在美国和许多其他国家推出,但在欧洲大部分地区和英国的推出可能还需要一段时间。
值得注意的是,就在Sora发布前一周,一群自称参与OpenAI alpha测试计划的艺术家泄露了该产品,以抗议OpenAI将其用于他们所称的无偿研发和公关。这一事件无疑为Sora的发布增添了一丝波折。
作为生成式人工智能领域的佼佼者,OpenAI一直致力于将多模态性(即文本、图像和视频生成的结合)作为其发展目标之一。Sora的推出正是这一目标的体现,它希望与meta、谷歌等公司的视频生成AI工具展开竞争。谷歌在1月宣布推出Lumiere,而Stability AI也推出了Stable Video Diffusion等类似的AI工具。
YouTuber Marques Brownlee在周一早上率先体验了Sora,并在其频道上发布了长达15分钟的评测视频。他透露,Sora位于Sora.com上,主页滚动展示了最近生成并由OpenAI策划的视频。用户可以收藏这些视频到已保存选项卡中,以便以后查看,还可以组织到文件夹中,并查看制作视频时使用的文本提示。
据Brownlee介绍,Sora不仅可以根据上传的图片和提示生成视频,还可以编辑现有的Sora制作的视频。使用重新混合功能,用户可以描述他们希望在视频中看到的更改,Sora会尝试将这些更改合并到新生成的剪辑中。然而,Brownlee也指出了Sora存在的一些问题,如物体永久性相关的问题以及腿部运动的混乱。
尽管如此,Sora仍然以其强大的功能和创新性吸引了大量用户的关注。随着聊天机器人和图像生成器逐渐进入消费者和商业领域,视频生成很可能成为生成式人工智能的下一个前沿。然而,这也带来了新的挑战和争议,特别是关于虚假信息的传播和版权保护的问题。
为了应对这些挑战,OpenAI表示将继续努力改进Sora的性能和功能,并加强审核机制以确保内容的合法性和准确性。同时,他们也欢迎用户提供反馈和建议,以帮助他们不断完善这一创新的视频生成工具。