滚动资讯

当前位置：首页 > 资讯 > 业界动态 > 正文内容

腾讯微视凭BLENDer模型斩获VCR竞赛榜第一

时间：2020-11-30 15:46:32 来源：互联网编辑：星辉 发表评论无障碍通道

视觉常识推理VCR (Visual Commonsense Reasoning )是人工智能领域的前沿热点问题，我国《新一代人工智能发展规划》中也将从处理类型单一的数据到跨媒体认知、学习和推理的“跨媒体智能”纳入五大智能方向。

近日，腾讯微视视频理解团队在多模态理解领域最权威排行榜之一VCR任务中荣登榜首。该团队提出的BLENDer(BimodaL ENcoDer)模型超越百度、谷歌、微软、Facebook等多家研究机构的模型效果，一举成为单、多模型的三项指标第一，值得注意的是，BLENDer仅凭单模型效果便超越了此前榜单上的多模型最好效果，赋予了机器更强大的理解和认知能力，并深度应用到短视频领域。

赶超百度、谷歌等，腾讯微视AI团队登顶VCR榜首

VisualCommonsense Reasoning (VCR)任务于2018年由华盛顿大学的研究人员首次提出，任务旨在将图像和自然语言理解二者结合，验证多模态模型高阶认知和常识推理的能力，让机器拥有“看图说话”的能力, 例如VCR能够通过图片中人物的行为，进一步推理出其动机、情绪等信息。VCR榜单是多模态理解领域最权威的排行榜之一，也是当前图像理解和多模态领域层次最深、门槛最高的任务之一，吸引了微软、谷歌、Facebook、百度、UCLA等国内外公司和研究机构纷纷参与。

此次拔得头筹的单模型BLENDer来自于腾讯微视视频理解团队，超越上一届榜首百度团队的多模态预训练模型 ERNIE-ViL-large成为新的VCR榜单霸主。

据相关负责人介绍，BLENDer模型已经应用到腾讯微视产品中，赋予了平台更强大的认知能力，使得包含文本、音频、视频等多种媒体信息在内的短视频内容，能够更好的做到分类和识别，更加精准理解和挖掘这些海量的跨媒体信息。例如当腾讯微视用户创作视频后平台可识别内容并精准推荐适合的话题，也能根据内容属性快速推荐给感兴趣的用户，增强创作内容的曝光。

腾讯微视视频理解团队提出的单模型BLENDer，是基于前沿的视觉语言Bert模型，将整个学习过程分成三个阶段，最终将任务的三项问答准确率一举提高到了81.6, 86.4, 70.8的水平，仅是BLENDer单模型上的表现已经超过此前各业界公司和研究机构的多模型融合效果。

在BLENDer模型中，第一阶段以NLP中的Bert模型为起点，结合海量数据中抽取得到的数百万张图片和对应描述文本作为BLENDer的输入进行多模态训练;第二阶段，在视觉常识推理数据集上学习电影中的场景和情节，使模型在新数据上获得更好的迁移能力;第三阶段，引入最终问答任务，让BLENDer利用已有的知识和常识对现有问题进行人物-人物、人物-场景之间关系的挖掘和关联进行推理，得到最终的答案。

腾讯微视将人工智能技术赋能短视频

一直以来，腾讯微视高度关注技术研发，腾讯微视视频理解团队更是长期深耕多模态语义理解领域，持续进行技术突破和落地，将相关技术应用在海量图像、视频、文本等跨媒体信息的认知推理中。

同时，腾讯微视团队也不断从业务出发探索前沿领域，并将人工智能技术应用到短视频生态中，贯穿内容创作、内容审核以及内容分发的各个环节。

在内容创作环节，腾讯微视将3D人脸、人体、GAN等AI技术结合AR技术辅助用户进行内容创作，让创作过程更加便捷、有趣和普惠;在视频审核环节，腾讯微视借助图像检测、分类、多模态理解等AI技术精准识别视频内容，提升审核效率，使得用户生产的内容最快时间触达消费者，目前腾讯微视内容处理效率已取得业界领先水平;而在视频分发环节，腾讯微视借助AI技术从非结构化的图像、音频、文本数据中提取结构化信息输出，如标签、特征等，支撑分发精准匹配用户。

未来，人工智能将具备更加多元、深度的交流学习能力，而技术的创新和精进将进一步推动AI技术在短视频业务中智能交互场景的落地。

举报 0 收藏 0 打赏 0评论 0

更多>同类资讯

富途控股股权结构新变动：李华持股稳定，腾讯减持套现2亿

04-18

雾芯科技股权结构揭秘：汪莹持股过半，经济价值达4亿美元

04-18

唯品会股权结构揭秘：沈亚持股17%稳坐C位，洪晓波及腾讯分获巨额股息

04-18

佳能PRO系列打印机新品登场，A2幅面最长可打3.276米照片！

04-18

德施曼智能锁导购大赛落幕，行业服务标准新高度如何铸就？

04-18

希捷报告：机械硬盘环保表现远超SSD，冷数据存储性价比之选？

04-18

AMD RX 9070 GRE性能前瞻：能否在中端市场挑战RTX 5060 Ti？

04-18

微软宣布：部分Windows版本将弃用VBS enclaves安全功能

04-18

2025人力资源管理杰出奖盛典：共探智能时代下人才战略新路径

04-18

《超级少女：明日之女》激战片段抢先看，神秘反派身份成谜！

04-18

十铨科技新推：X2 MAX高速双接口SSD与轻巧S5闪存盘亮相

04-18

中国移动5月起亲情网资费大调整，基本功能费降至5元/月！

04-18

海南大学发布脑机接口全链条技术，国产“芯”助力科研医疗新飞跃

04-18

字节跳动开源：云原生全局最优重调度框架Godel-Rescheduler

04-18

森养AF14-24mm F2.8 FE全画幅镜头即将发布，重量仅445克！

04-18

点击查看更多 +

全站最新

阿维塔06明日上市：纯电增程双选择，智能配置引期待

全新大众朗逸Pro亮相，前卫前脸设计能否赢得市场青睐？

燃油车电费破五百，电动车百公里费用几何？成本对比让人意想不到！

新款沃尔沃S90焕新上市：轻混插混双动力，内外全面升级！

岚图全尺寸大六座SUV来袭，2025年发布，科技配置抢先看！

宝骏享境上海车展亮相，预售13.28万起，智能领航驾驶成亮点

热门内容

本栏最新

富途控股股权结构新变动：李华持股稳定，腾讯减持套现2亿

雾芯科技股权结构揭秘：汪莹持股过半，经济价值达4亿美元

唯品会股权结构揭秘：沈亚持股17%稳坐C位，洪晓波及腾讯分获巨额股息

佳能PRO系列打印机新品登场，A2幅面最长可打3.276米照片！

德施曼智能锁导购大赛落幕，行业服务标准新高度如何铸就？

希捷报告：机械硬盘环保表现远超SSD，冷数据存储性价比之选？

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.