近日,谷歌在AI技术领域迈出了重要一步,为Gemini Advanced订阅用户带来了其最新的视频生成AI模型——Veo 2。从本周二起,Gemini Advanced用户将能够在Gemini应用程序的模型选项中找到Veo 2,这一创新技术源自DeepMind,为用户提供了前所未有的视频创作体验。
Veo 2允许用户通过简单的文本或图像提示,生成8秒钟的视频片段,分辨率为720p,宽高比为16:9。这一功能不仅为用户提供了便捷的视频创作工具,还拓宽了视频内容的创作边界。用户可以通过Gemini的分享功能,轻松将这些视频上传至TikTok、YouTube等社交平台,或下载带有谷歌SynthID水印的MP4文件。然而,谷歌也明确表示,目前该功能对每月可创建的视频数量有所限制,并且暂不支持谷歌Workspace的商业和教育计划。
不仅如此,谷歌还在其Google Labs的实验性功能Whisk中整合了Veo 2。Whisk原本就允许用户使用图片作为提示词来生成新图片,而此次新增的Whisk Animate功能,更是将用户生成的图片转化为由Veo 2生成的8秒视频。Google Labs作为谷歌展示早期AI产品的平台,目前仅对Google One AI Premium订阅用户开放,订阅费用为每月20美元。
谷歌推出Veo 2的举动,被外界视为对OpenAI Sora平台的有力回应。Sora平台以其强大的文本到视频生成能力而备受瞩目,在教育、娱乐等多个领域展现出广泛应用前景。例如,Sora可以生成与课程内容紧密相关的视频,为在线教育提供有力支持。相比之下,Veo 2在功能上虽然相对基础,但谷歌DeepMind首席执行官德米斯·哈萨比斯表示,公司计划将Gemini AI模型与Veo相结合,以提升Gemini对物理世界的理解能力,这将为Veo 2的未来发展带来无限可能。
然而,随着Veo 2、Sora等视频生成工具的出现,艺术家和创作者们也开始表达他们的担忧。这类工具的出现可能会对整个创意产业造成颠覆性影响。据好莱坞动画师和漫画家工会委托进行的一项研究显示,到2026年,AI技术将扰乱美国超过10万个电影、电视和动画领域的就业岗位。这一预测引发了广泛关注和讨论,关于AI技术与人类创意产业的未来关系,也成为了业界和学术界关注的热点话题。