滚动资讯

当前位置：首页 > 资讯 > 业界动态 > 正文内容

网易伏羲三项研究入选CVPR顶会：AI感知表情能力将达到人类水平

时间：2021-03-05 23:09:37 来源：互联网编辑：星辉 发表评论无障碍通道

2月28日，人工智能顶级会议CVPR 2021(国际计算机视觉与模式识别会议，Conference on Computer Vision and Pattern Recognition)公布论文录取结果，网易伏羲共有3篇论文入选。

其中，由网易伏羲虚拟人团队发表的一项研究颇为引人关注。该研究提出了一种人类表情编码的创新提取方法，大幅提升了AI感知人类表情的精度。随着该技术的发展，未来，AI感知人类表情的能力甚至有望超越人类感知平均水平。

这一技术的应用场景十分广泛，包括测谎、性格评估、自闭症检测、表演能力评估等众多与人脸表情相关的领域。

过去，学术界对人类表情的识别和描述，一般源于两种传统理论：一种源自150年前的达尔文时期，学者们从心理学出发，基于高兴、惊讶、生气、悲伤等有限的情绪类别描述人类表情;另一种起源于上世纪70年代末，知名心理学家Paul Ekman博士从解剖学角度出发，基于人脸肌肉运动，用27种动作单元来描述人类表情。

从数量上看，传统理论对人类表情的描述极为有限。网易伏羲的人类表情编码提取方法，则以人工智能的方式进一步突破了这一瓶颈。通过学习大量的人脸表情数据，AI可以无穷尽、无上限地感知人类表情。

为了让AI更懂人类的喜怒哀乐，技术人员还需要大量细颗粒度、人工标注的人脸表情数据用于算法参数迭代，进一步提升表情编码的精度。为此，网易伏羲正在开发一个游戏化标注小程序，让普通用户能够在游戏的过程中，轻轻松松地参与表情标注，加速推进人类表情领域的人工智能研究与应用。

网易伏羲成立于2017年，是国内从事游戏与文创AI研究和应用的顶尖机构，研究方向包括强化学习、图像动画、自然语言、虚拟人、用户画像、大数据平台等领域。据了解，此次CVPR中稿论文展示的部分科研成果，已经在网易多个产品中成功落地。未来，网易伏羲将继续以技术落地为导向，用科研成果推动产品创新。

附|网易伏羲三篇入选CVPR2021论文简介：

1、《去ID信息的表情编码》

（Learning a Facial Expression Embedding Disentangled from Identity）

论文简介：

本文研究的主要目的，是获取一种紧致的，且与ID信息无关的人脸表情表征。

本研究中，网易伏羲虚拟人团队首次提出，将表情特征建模为从ID身份特征出发的一个差值向量，以这种显式方式去掉ID的影响。为此，本研究设计了一个伪孪生结构的网络去学习这种差值。同时，为了加强网络在深层的学习能力，本研究通过高阶多项式的方法替代一般的全连接层去完成从高维到低维的映射。另外，考虑到不同标注者存在一定标注噪音，本研究增加了众包层学习不同标注者的偏差，使学习到的表情表征更加鲁棒。

定性和定量的实验结果表明，该方法在FEC数据集上超越了前沿水平。同时在情绪识别、图像检索以及人脸表情生成等应以用上都有不错的效果。

(论文的Pipeline)

下图展示了该工作的表情表征编码的效果，输入一张检索(Query)表情，通过比较表情编码的距离，从一个足够大的人脸数据集中检索出与之最相似的一些表情(Results)，下图中展示了TOP5的结果。

(本研究中表情表征的效果)

由图可知，所检索出来的图像和目标表情非常接近，说明本研究提出的表情表征编码可以感知微妙且精细的表情。

2、《基于稠密运动场的高清说话人脸视频生成》

（Flow-based One-shot Talking Face Genaration with a High-resolution Audio-visual Dataset）

论文简介：

One-shot说话人脸合成的目的，是给定任意一张人脸图像和任意一段语音，合成具有语音口型同步、眉眼头动自然的高清说话人脸视频。之前工作合成的视频分辨率之所以一直受到限制，主要有两个原因：1、目前没有合适的高清视听数据集。2.之前的工作使用人脸特征引导人脸图像合成，而对于高分辨率图像来说特征太稀疏。

为了解决上述问题，本研究首先收集了一个无约束条件下(in-the-wild)的高清人脸音视数据集YAD，该数据集比之前无约束条件下的数据集更加高清，也比之前实验室环境下(in-the-lab)数据集包含有更多的人物ID。

基于高清数据集YAD，本研究借助三维人脸重建(3DMM)将整个方法分成表情参数合成和视频图像合成两个阶段;在表情参数合成阶段中，使用多任务的方法合成嘴唇运动参数、眉眼运动参数和头部运动参数。在视频图像合成阶段，则使用稠密运动场替代人脸关键点引导人脸图像生成。定性和定量结果表明，与之前的工作相比，本研究可以合成更加高清的视频。以下二图分别展示方法的流程图和视频合成效果。

(论文的pipeline)

(实验的合成结果)

3、《神经风格画笔》

（Stylized Neural Painting）

论文简介：

网易伏羲与密歇根大学合作研究，提出了一种图像到绘画的转换方法。该方法可以生成风格可控、生动逼真的绘画作品。不同于神经风格迁移方法，网易伏羲在参数化的条件下处理这种艺术创作过程，并产生一系列具有物理意义的画笔参数。

(借助神经可微渲染器，AI可以创造出高相似度，又独具风格的绘画作品)

由于经典的矢量渲染是不可微的，因此我们设计了一种全新的神经可微渲染器。它可以模仿矢量渲染器的行为，然后将画笔预测转换为参数搜索过程，即最大化输入与渲染输出之间的相似度。

实验表明，通过该方法生成的绘画在整体外观、局部纹理上都具有很高的保真度;该方法也可以与神经风格迁移共同优化，后者可以进一步迁移其他图像的视觉样式。

举报 0 收藏 0 打赏 0评论 0

更多>同类资讯

芜湖造心脏，驱动国家级无人直升机救援平台展雄风！

12-19

神策智能运营新升级，如何助力企业实现高效精准营销？

12-19

顺丰控股11月收入稳健增长6.73%，供应链及国际业务增速亮眼

三言科技12月19日消息，今日，顺丰控股公告，2024年11月公司速运物流业务及供应链和国际业务合计收入为251.96亿元，较2023年同期236.08亿元增长6.73%。其中，速运物流业务收入为188.02…

12-19

荣耀股东变动引关注，官方称系股权架构调整

三言科技12月19日消息，近日，多则网传荣耀新一轮股改已完成。据媒体报道，荣耀的股东名单已经发生变更，有国资背景的股东显示退出。信息显示，9月刚刚加入的新股东杭州微同股权投资合伙企业（有限合伙），于11月退出…

12-19

顺丰航空引领！国内全货机首次SAF商业飞行成功落地

12-19

中央经济工作会议力推哪些新兴经济模式？

12-19

水滴公司Q3财报亮点：营收稳步增长，运营利润达2650万

12-19

技嘉冰雕X870I主板全白亮相，AORUS PRO ICE图赏来袭！

12-19

宠物粮市场乱象频发，铲屎官如何为宠物选对粮？

据“趣解商业”了解，“源鲜”曾是网易严选、喵梵思等国产中高端品牌多次合作的代工厂，在不少养宠人心中有较高信任度；“源鲜”的塌房，再次挑动了许多养宠人的神经。 Erica还提到，宠粮本质上属于快消行业，并不是靠…

12-19

柔韧机器人：具身智能的新赛道与革命性突破？

相比于现阶段普遍使用的基于电机关节、金属材料、复杂传感器和精密加工工艺的“刚性”机器人技术，万勋科技通过使用软性材料与气/液驱动，以软材料仿生肌肉和神经元智能复刻人类肌肉柔韧特性，具备轻巧灵活、安全互动、易…

12-19

北京中关村科学城国际医谷开工，打造医疗健康产业集聚新高地

作为项目建设推进方，北京海新域城市更新集团相关负责人介绍，中关村科学城国际医谷项目将在产业链上游吸引顶尖研发机构和企业，汇聚创新源头力量；在中游通过公共技术服务平台降低研发门槛，助力创新的想法实施；在下游建…

12-19

《猎人克莱文》IGN仅评3分，高成本制作却换来低质口碑？

12-19

中兴通讯股价异动，公司称生产经营正常，无未公开重大信息影响股价

12-19

顺丰控股11月速运物流营收微增，供应链及国际业务增长超两成

12-19

澳门风情画轴展开，智界新S7穿梭其中成焦点

12-19

点击查看更多 +

全站最新

TCL万象分区技术：Mini LED电视画质跃升的新篇章

挪威电动车热销，特斯拉陶琳：寒冷地区电动车可完全替代燃油车

宝马Skytop M8 Targa限量版来袭，概念车终成真！

芜湖造心脏，驱动国家级无人直升机救援平台展雄风！

《黑神话：悟空》获赞，海信E8共绘中国文化出海新篇章

值得买科技荣获卓越发展大奖，创新驱动消费产业高质量发展

热门内容

本栏最新

芜湖造心脏，驱动国家级无人直升机救援平台展雄风！

神策智能运营新升级，如何助力企业实现高效精准营销？

顺丰航空引领！国内全货机首次SAF商业飞行成功落地

中央经济工作会议力推哪些新兴经济模式？

水滴公司Q3财报亮点：营收稳步增长，运营利润达2650万

技嘉冰雕X870I主板全白亮相，AORUS PRO ICE图赏来袭！

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区 · 齐鲁软件园鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.