即梦AI在官方社交媒体平台上震撼发布了一则关于全新功能即将上线的预告,引发广泛关注。这项名为OmniHuman的多模态视频生成模型,凭借其独特的技术魅力,为用户带来了前所未有的视频创作体验。用户只需简单地上传一张图片和一段音频,OmniHuman便能迅速生成一条栩栩如生、充满活力的AI视频,极大地提升了AI短片制作的效率与质量。
据透露,OmniHuman是字节跳动公司自主研发的闭源模型,其技术主页详细介绍了该模型的强大功能。无论是肖像、半身还是全身等不同尺寸的图片输入,OmniHuman都能根据音频内容,在视频中让人物呈现出与之相匹配的动作,如演讲、唱歌、乐器演奏以及行走等。这一技术不仅解决了人物视频生成中常见的手势崩坏问题,还显著提升了生成视频的自然度。
OmniHuman在动漫、3D卡通等非真人图片输入方面也展现出了卓越的表现。它能够保持特定风格和原有的运动模式,生成的视频效果令人惊叹。这一技术的突破,无疑为视频创作者提供了更多的创作可能性和想象空间。
为了防止这项技术被滥用,字节跳动技术团队在OmniHuman的技术主页上特别注明,该模型将不会对外提供下载。这一举措不仅体现了字节跳动对技术安全的重视,也彰显了其作为科技企业的社会责任感。
即梦AI的相关负责人表示,尽管OmniHuman已经展现出了出色的表现,但在生成影视真实级别的视频方面,仍存在一定的提升空间。因此,该模型支持的多模态视频生成功能将首先在即梦平台上进行小范围内测,以便进行进一步的调优和调整。同时,即梦还将为这一功能设置严格的安全审核机制,并对输出的视频标注水印,以确保AI技术的正面应用和积极作用。
随着OmniHuman技术的不断成熟和完善,相信它将为视频创作者带来更多的惊喜和灵感。同时,即梦AI也将继续致力于技术创新和用户体验的提升,为用户提供更加优质、便捷的视频创作服务。