近期,科技巨头谷歌在人工智能领域再次迈出重要一步,正式推出了其最新的视频生成模型Veo 2。这一创新技术不仅在分辨率和时长上实现了显著提升,更在视频的真实感和细节呈现上取得了突破性进展。
据了解,Veo 2能够生成最高达4K(4096 x 2160像素)分辨率的视频片段,且时长可达2分钟。与OpenAI的Sora模型相比,Veo 2在分辨率上提升了整整4倍,视频时长也增加了6倍之多。这一能力无疑为视频创作领域带来了全新的可能性,原生4K的直出效果更是令人惊叹。
Veo 2的强大之处在于,它不仅能够根据给定的文本提示或文本与参考图像生成视频,还能更真实地模拟物体的运动、流体动力学以及光的属性。这一点在推特上一位网友分享的切西红柿对比视频中得到了直观体现,Veo 2的表现明显优于Sora模型。
谷歌DeepMind团队在Veo 2的研发上投入了大量精力,以确保其在保真度、准确度和相机控制方面达到前所未有的水平。Veo 2在细节呈现上更为真实,伪影现象大幅减少;同时,它更懂得物理世界的运作规律,能够遵循详细的指令,高度准确地表现各种运动场景。Veo 2还具备电影摄影的独特语言,能够创建多种拍摄风格、角度和动作,为用户带来丰富的视觉体验。
为了应对Deepfake等技术的潜在风险,DeepMind团队还开发了专有的水印技术SynthID。这一技术能够将隐形标记嵌入到Veo 2生成的帧中,从而确保视频内容的可追溯性和真实性。这一举措无疑为视频内容的版权保护和真实性验证提供了有力支持。
除了Veo 2之外,谷歌此次还推出了改进版的AI绘图模型Imagen3。Imagen3在生成图像方面同样表现出色,细节更为丰富,光照效果更为自然,且干扰更少。这一模型的推出,无疑将进一步推动AI绘图技术的发展。
Veo 2和Imagen3的推出,标志着谷歌在人工智能领域又迈出了坚实的一步。这两项技术的创新和应用,将为视频创作和图像生成领域带来全新的变革和机遇。