近日,第一财经传来消息,字节跳动旗下的一站式AI创作平台即梦AI即将推出一款名为OmniHuman的多模态视频生成模型。这款模型能够通过一张图片与一段音频,自动生成AI视频,展现出了强大的技术实力。据悉,OmniHuman为字节跳动自研的闭源模型,标志着字节跳动在AI视频生成领域迈出了重要一步。
据即梦AI相关负责人介绍,OmniHuman模型将在未来进行小范围内的测试。为了确保内容的安全性和合规性,官方将设置严格的安全审核机制,对所有输出的视频进行仔细筛查。为了明确区分AI生成内容与真实内容,所有通过OmniHuman生成的视频都将被标注上独特的水印。
值得注意的是,字节跳动的研究人员近日已经向外界展示了OmniHuman模型的部分功能。通过一张图片和一段音频,该模型能够生成半身乃至全身的视频动画。这一功能与此前只能生成面部或上半身动画的深度伪造技术相比,无疑是一个巨大的进步。OmniHuman-1不仅能够生成逼真的全身动画,还能够将手势和面部表情与语音或音乐精准同步,为用户带来更加真实、生动的视觉体验。
据了解,OmniHuman模型的推出,将进一步丰富即梦AI平台的功能,为用户提供更多样化的创作选择。无论是想要制作个人短片、广告宣传还是其他类型的视频内容,用户都可以借助这款模型,以更加高效、便捷的方式实现自己的创意。
随着AI技术的不断发展,越来越多的创新应用正在不断涌现。字节跳动此次推出的OmniHuman模型,无疑为AI视频生成领域注入了新的活力。未来,我们期待看到更多像OmniHuman这样的创新应用,为我们的生活和工作带来更多便利和乐趣。