滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

LipDub CEO谈视频生成：挑战在于效率与成本，AI技术引领创新

时间：2024-12-13 12:34:35 来源：ITBEAR编辑：瑞雪 发表评论无障碍通道

在北京市大兴区，一场聚焦全球化和人工智能的科技盛宴于2024年12月6日至7日盛大举行。这场名为2024T-EDGE创新大会暨钛媒体财经年会的活动，汇聚了全球科技和商业领域的精英，共同探讨企业全球化增长的新趋势，以及人工智能对全球各行业的深远影响。

在影视制作领域，一个长期存在的挑战是如何精准捕捉人物的面部、嘴型、表情和肢体动作，尤其是在视频生成过程中。细微的动作位移和差异都可能导致失真，而要达到好莱坞级别的影视效果，往往需要巨大的投入。然而，随着生成式AI技术的迅猛发展，这一难题正在被逐步攻克。

MARZ，一家著名的视觉效果（VFX）工作室和AI技术初创公司，于2023年8月推出了新一代AI视效产品——LipDub。这款产品的诞生，旨在解决影视配音中口型不同步的顽疾。在演讲中，LipDub的首席执行官Jonathan Bronfman详细介绍了这款产品的技术原理和应用场景。他透露，LipDub采用了三种方案来实现口形同步：直接对视频进行翻译、通过定制虚拟形象进行对话调整，以及通过一段语料实现角色的量身定制。

MARZ的AI研究团队由特拉维夫大学计算机科学系的知名教授Danny Cohen-Or领导，他是ACM研究员和Isaias Nizri视觉计算主席。Cohen-Or教授与西蒙弗雷泽大学的助理教授Ali Mahdavi-Amiri长期合作，共同领导了MARZ的AI研究。他们此前已成功开展了Vanity AI的研究，这是MARZ开发的第一个AI解决方案。Vanity AI能够通过AI美妆技术，针对人物面部皱纹进行年轻化处理，已在45多个好莱坞作品中使用。

Jonathan在演讲中指出，生成式AI技术已经演进到文生图、图生视频的阶段。对于营销人员和内容创作者来说，这意味着他们可以在极短的时间内生成视频内容，从而快速验证视频效果。然而，视频内容生成的挑战依然存在，即速度慢且成本高。但随着技术的进步，用户现在可以在几分钟内生成一段视频，并且同一段视频素材也可以反复使用。

LipDub的口形同步技术不仅适用于真人片段，还进一步扩展到了CG角色制作。Jonathan强调，好莱坞影视画面的要求不仅仅是口型同步，而是要确保对原始人物/角色表演进行1比1的还原，同时传递出饱满的情绪。为了实现这一目标，LipDub采用了Language Agnostic模型，以实现跨语言无关特征学习。

目前，LipDub已经宣布了beta版，并预计在今年年底取得新的进展。除了服务于好莱坞电影外，LipDub还扩展到了广告、在线教育、企业宣传片等多个领域。在在线教育视频场景中，LipDub能够营造出真实的听众体验，让人感觉就像是说话人自己的语言。LipDub还提供了初级和高级两种模式供用户选择，以满足不同需求。

在演讲的最后部分，Jonathan展示了LipDub的新功能——替换对话框（Replace Dialogue）。这一功能类似于文本到语音的转换，但更加灵活和准确。用户可以轻松修改视频中的对话内容，并确保跨语言转换时能够恰当地传递情感。

举报 0 收藏 0 打赏 0评论 0

更多>同类资讯

谷歌Android XR系统亮相，融合AI、AR/VR技术，安卓应用全面支持

12-13

紫光云芯片云3.0：四重升级，赋能芯片设计企业新未来！

12-13

ST天喻全资控股新公司，涉足AI软件开发与网络技术领域

12-13

FF 91再迎新主人，超模设计师Suede Brooks共创新未来出行

12-13

谷歌Android XR系统震撼亮相，三星头显首发，安卓应用全面兼容

12-13

容联云新金融论坛：共探数智化转型新路径与大模型创新应用

容联云副总裁兼诸葛智能创始人孔淼深入剖析了当前金融行业数智化转型的现状与挑战，并分享了容联云在这一领域的最新实践与洞察。容犀坐席代理可以高效识别客户真实意图，并进行智能推荐和话术指导、会话小结，增强产品推广…

12-13

AI大模型新趋势：李开复、周志华等顶流大咖共话未来智能

12-13

OPPO发布风驰游戏内核，游戏体验能耗比帧率双提升，引领行业新高度！

12-13

Infor全球调研：高效组织如何借技术投资实现价值飞跃？

12-13

科大讯飞AI虚拟人平台登顶！获信通院L5最高级认证，全面免费开放

12-13

高通技术公司首席技术官将换任，Achour博士接力聚焦6G与AI

12-13

亚朵：以“中国体验”领跑酒店业，荣获最具创新力上市公司奖项

其中具有代表性的，是亚朵以峰终定律为参考，拆解“预定-住店-离店”过程为17个关键触点，在传统奢华酒店SOP外为客户提供有记忆点、强人文关怀的服务，专注提升住宿体验，通过空间、内容、人和品牌四个维度实现“人…

12-13

博通财报亮眼，AI收入增长两倍多，股价盘后飙升15%！

12-13

Meta推出Meta Motivo AI，助力元宇宙体验更逼真

12-13

谷歌三星联手发布Android XR，头显设备体验将迎大升级？

12-13

点击查看更多 +

全站最新

机械师G1 Pro游戏手柄京东首销，双1KHz回报率仅售129元！

马智欣掌舵，日产能否在中国市场打一场漂亮的“翻身仗”？

Mac不再只是设计师专属，它如何成为越来越多企业的得力助手？

OPPO、vivo超大杯新机来袭：6000mAh电池+2K屏，影像系统成亮点？

小米SU7月销超特斯拉Model 3，成“真Model 3杀手”实至名归？

《无限暖暖》走红：少女换装新体验，梦幻世界等你来探索！

热门内容

本栏最新

谷歌Android XR系统亮相，融合AI、AR/VR技术，安卓应用全面支持

紫光云芯片云3.0：四重升级，赋能芯片设计企业新未来！

ST天喻全资控股新公司，涉足AI软件开发与网络技术领域

FF 91再迎新主人，超模设计师Suede Brooks共创新未来出行

谷歌Android XR系统震撼亮相，三星头显首发，安卓应用全面兼容

AI大模型新趋势：李开复、周志华等顶流大咖共话未来智能

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区 · 齐鲁软件园鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.