在人工智能技术发展的基础上,越来越多的新业态正在涌现。近日,百度大脑开放平台上线视频人脸融合产品,用户可通过人脸编辑技术,定制化生成非常接近真人的虚拟人脸图,并可高保真地替换已有视频素材中的形象。背靠百度大脑开放平台领先的图形图像AI技术,这一产品解决了广告创意、互动娱乐、游戏影视等行业打造虚拟IP被高门槛要求拒之门外的痛点,同时又可以规避肖像权与隐私权风险,应用前景广阔。
官网信息显示,该产品可生成不同种族、年龄、性别、五官风格、肤色等的虚拟人物形象,满足用户的全方位需求。最重要的是,以前视频换脸总是伴随侵权风险,而该产品可以让你打造专属你本人IP的虚拟人脸,全程合法合规,可有效保障肖像权与隐私权,避免风险。此外,网络生成的形象可以定制观赏性高的角色,以满足虚拟广告形象、虚拟主播形象、虚拟游戏影视形象等领域的高要求。
在效果上,不同场景均可以打造出观赏性好,趣味性强,风格独一的虚拟形象,且输出的视频可以保持高清晰度,并消除关键点、颜色等的抖动,具有非常高的稳定性。同时,产品的使用操作也相当简易化,无需海量素材,仅一张图片即可实现视频级别形象替换,很快就能得到结果,仅需非常低的用户成本。
(视频人脸融合产品输出效果)
据了解,视频人脸融合技术在实际应用中,往往因为视频画面的复杂性,造成面容僵硬、光照条件变化、身份信息失真等问题,影响观众体验,而且传统解决方案输出效率也较低。对此,百度大脑视频人脸融合产品利用极易获取的先验知识,如3DMM系数,区域纹理编码等,通过生成模型实现对于任意人脸的全方面编辑,涵盖身份、姿态、表情、光照、妆容等维度,具备很大的灵活性,同时展现出强大的控制力。
(人脸形象替换示例,每列依次为换脸,换妆,光照控制效果)
为保障视频人脸融合输出的高质量与高保真度,百度团队设计了Identity-Style Normalization Module框架,可利用身份信息和区域纹理编码对主干生成网络特征进行调制,使得视频源的身份和区域纹理信息得到最大化的保留,在“换脸”时让观众很难分辨出差异。同时,该产品利用一个简单的前向模型来实现,仅用单图就能对视频进行换脸,数据效率更高。
此外,鉴于该方案在人脸融合技术领域的领先性,百度相关论文得到学术界肯定,被美国人工智能协会(AAAI)2021年会收录。同时,该产品面向娱乐行业的相关从业人员或爱好者,用户可在百度大脑开放平台官网进入产品页面,更多信息可访问:https://ai.baidu.com/tech/face/facemerge_video。
(视频人脸融合技术框架)
借助这一全新产品,更多开发者与从业者将能够体验到虚拟角色形象带来的新潜力,延伸出更多的玩法,让娱乐行业更智慧化。实际上,作为百度打造的新型AI技术基础设施,百度大脑正通过这些技术能力与产品方案的输出,在工业、农业、教育、零售、文化娱乐、企业服务等众多行业落地创新应用和智能化升级,仅AI能力就开放了273项。未来百度大脑也将持续开放能力和产品,让更多行业走上AI之路,发展新业态,提供新动能。