ITBear旗下自媒体矩阵:

即梦AI新技能:图+音合成视频,内测即将开启!

   时间:2025-02-07 18:35:14 来源:ITBEAR编辑:快讯团队 发表评论无障碍通道

近日,即梦AI在官方社交媒体平台上发布了一则令人瞩目的消息,预告了其即将上线的新功能。这项功能的核心在于一个名为OmniHuman的多模态视频生成模型,该模型由字节跳动自主研发,旨在通过用户提供的单张图片和音频文件,自动生成富有生动感的AI视频。

根据即梦AI发布的预告视频显示,OmniHuman模型的应用场景极为广泛。用户只需简单地上传一张包含人物肖像、半身或全身的图片,并搭配一段音频,模型便能在视频中让该人物根据音频内容做出相应的动作,无论是演讲、唱歌、演奏乐器还是移动,都能呈现得栩栩如生。这一技术有望极大地提升AI短片的制作效率和质量。

OmniHuman模型在解决人物视频生成中常见的手势崩坏问题上,相较于现有方法取得了显著的进步。该模型还支持非真人图片输入,如动漫、3D卡通等,生成的视频能够保持输入图片的特定风格和原有的运动模式,这一特性无疑为创作者提供了更多的可能性。

据即梦AI技术主页的信息显示,OmniHuman模型为闭源模型,这意味着它不会对外公开下载。这一决策可能是为了防止该技术被不当利用。同时,从技术主页展示的演示效果来看,OmniHuman的生成效果已经相当自然,令人印象深刻。

尽管OmniHuman模型已经表现出色,但即梦AI的相关负责人透露,该模型在生成影视真实级别的视频上仍存在一定的提升空间。因此,由该模型支持的多模态视频生成功能将在即梦平台上以小范围内测的形式进行调优调整,并逐步向用户开放。

为了确保AI技术的正面应用,即梦AI还宣布将对此功能设置严格的安全审核机制,并对输出的视频标注水印以作提醒。这一举措旨在保障视频创作者能够更好地实现想象力的表达,同时防止技术被滥用。

随着OmniHuman模型的逐步推广和应用,我们有理由相信,AI视频生成技术将迎来一个全新的发展阶段,为视频创作者提供更多元化、更高效的创作工具。

举报 0 收藏 0 打赏 0评论 0
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  RSS订阅  |  开放转载  |  滚动资讯  |  争议稿件处理  |  English Version