平均mAP大幅提升，百度研究院夺得CVPR SoccerNet-v2足球视频理解竞赛双冠

时间：2021-06-29 19:37:49 来源：互联网编辑：星辉 发表评论无障碍通道

2021欧洲杯足球赛近日“姗姗来迟”，牵动了无数球迷的心。精彩的球赛视频背后，令人意想不到的是AI技术正在重塑体育视频产业的内容生产方式。

在近期举办的国际计算机视觉与模式识别顶会CVPR 2021上，视频理解领域最具影响力的International Challenge on Activity Recognition (ActivityNet) workshop旗下多个竞赛公布榜单。竞赛吸引了百度、阿里、字节跳动、腾讯、华为等知名企业和清华、北大、斯坦福、麻省理工学院、中科院等国内外高校和机构参与。其中，全球首个以足球比赛视频的全方位理解为目标的SoccerNet-v2足球视频理解竞赛中，百度研究院以绝对优势夺取了全部两项任务的冠军。

百度拿下全部两项任务冠军

本届竞赛所使用的 SoccerNet-v2数据集在足球理解领域规模最大，包括500场来自2014到2017年三个赛季的欧洲足球五大联赛和欧洲冠军联赛的视频，视频总时长达到764小时，人工标注达30万个，成为国际AI团队间衡量足球视频理解能力的重要标准。

双任务项目夺冠大幅提升基线平均mAP

本届SoccerNet-v2竞赛下设了事件定位(action spotting)和回放溯源(replay grounding)两个任务。其中，事件定位(action spotting)是从足球比赛实况转播视频中找到一些关键事件并确定其发生的时刻。关键事件包括17个类别，涵盖进球、点球、任意球、红牌、黄牌、角球等重要事件，以及犯规、越位、射正、射偏等人类也难以立刻分辨的事件。同时有一部分事件甚至并未被直接拍摄到，需要根据上下文来推测，这也是对视频动作识别和事件检测能力的一个挑战。

回放溯源是(replay grounding)是把足球比赛转播视频中的回放片段和原始事件进行匹配。在足球比赛视频中一个精彩事件发生之后往往有多次回放，且回放和原始事件之间可能会相隔长达上百秒，拍摄视角也经常不同，能否将回放片段和原始片段匹配是对超长距离视频理解能力的一项考察。

百度研究院图文转视频VidPress团队专注于算法研究和应用创新，此次拿下两项任务的冠军，展现出了超群的技术实力。系统采用两阶段的方法，首先特征提取器提取足球视频特征，再将提取出的特征作为第二阶段具体任务模块的输入，进行事件定位或者回放溯源。

事件定位和回放溯源的系统流程

在特征提取阶段，团队认为在足球视频上微调过的特征提取器更有利于提升事件定位和回放溯源两个下游任务的表现，因此在SoccerNetv2数据上微调了五种预训练的特征提取器模型：TPN、GTA、VTN、irCSN和I3D-Slow。这五种特征提取器模型均是最近年来视频理解领域在分类任务上表现优异的模型，在标准数据集Kinetics-400上的成绩也名列前茅。

在五种特征提取器模型之上，团队也充分利用数据，设计了多种微调特征提取器模型的策略、开发了提取特征的新方法。得到每种特征提取器在足球视频上提取的特征后，将五种特征连接起来并做了归一化处理，使得优化后的特征对足球比赛视频具有强大表达能力，为后面的下游任务打下了坚实基础。

在事件定位和回放溯源阶段采用了Transformer结构。Transformer架构的特点是更清晰、更标准化、模型容量大、扩展性强，能适应计算机视觉、自然语言等多种业务。Transformer结构在这两个任务中体现了对视觉语义特征的精确的时序处理能力，优于基线算法中Siamese网络的学习能力和训练速度。在训练过程中，事件定位采用了mix-up数据增强，更高效利用了训练数据、降低过拟合。在回放溯源的任务上，模型结构的更换使得训练时间减少到原来的八分之一。

结合前述的视觉信息语义化特征，以及为新的任务订制的Transformer结构，百度研究院在竞赛成绩上取得了较大幅度的领先。在事件定位任务上，把基线的平均mAP由52.54%提升到74.84%，提高了22.3个百分点，是第二名提升的近两倍；在回放溯源的任务上，把平均mAP由基线的40.75%提升到了71.90%，提高了31.15个百分点，比第二名63.91%的成绩高出8个百分点。

技术“照进”现实应用 智能视频生成工具应运而生

百度研究院之所以能够在该项竞赛中脱颖而出，离不开基于大规模视频数据的算法能力技术积累。

该项技术有非常高的实用价值，可以大规模应用于体育赛事视频中，通过对全场比赛进行智能识别，可以在不需要人工介入的条件下，精准、实时地切分出进球、射门、犯规等动作片段。

基于此项能力，团队开发出了一系列应用工具并成功落地。

首先是行业领先的自定义足球精彩集锦生成工具。输入球员后选定比赛场次，即可自动生成这个球员的精彩瞬间视频集锦以及慢动作回放。目前这一系统已经落地在百度百科400多个足球球员和球队页面。

输入球员名称+比赛名称，生成该球员的视频集锦

其次，将文本语义理解与视频图像理解贯通，团队还搭建了足球图文战报一键转换视频平台。输入文字直播内容或者直播间地址，就能智能聚合生成对应的视频内容，提高了战报的生成效率和可读性。

根据文字直播内容智能生成对应的片段视频

此外，团队还建立了基于图像场景识别的智能视频生产线，该生产线可以快速理解上传的长视频，检测是否有进球、精准定位视频中的进球瞬间，并完成自动剪辑。

上传一段比赛视频，自动识别生成进球片段

基于在智能视频技术上的不断创新和积累，百度研究院在2020年初孵化推出了智能图文转视频工具VidPress，是业界首个支撑通用型、大规模的全自动视频生产技术。VidPress能够支持图文链接一键导入，自动自动实现配音、字幕、画面的视频内容生产，降低素材搜集、整理、匹配的时间成本。目前VidPress已作为百度大脑智能创作平台中的核心能力，为人民日报等多家媒体机构的智能视频生产赋能；为秒懂百科智能生成上千条球员精彩瞬间视频；为百家号和好看视频等平台的终端用户提供一键视频生成服务。百度大脑智能创作平台基于自然语言处理、知识图谱、视觉、语音的整合技术能力，为创作者提供多项能力，助力新闻生产的策、采、编、审、发全流程，全面提升内容生产效率。

全视频时代到来，各行各业对视频的应用、体验和效能都提出了全新升级需求，智能视频变化趋势背后的驱动力少不了AI的身影。无论是足球比赛视频，还是其他内容丰富、形式多样的视频内容，未来百度也将持续在相关领域的技术上不断突破迭代，并持续赋能应用与产品落地，为视频行业的发展与变革注入充足动力。

近日，升腾公司正式推出了基于兆芯开先KX-7000系列处理器的新品桌面整机——P410 2。这款新机型不仅继承了升腾在政务办公、金融机构及大型企业等领域的丰富经验和深厚技术积累，更在关键软硬件上实现了信息技术创新，为行业信创的深入发展注入了新的活力和能量。升腾P41

车载音响是衡量豪华汽车的重要核心指标之一，在智能座舱中更是不可或缺的重要配置，而高品质的车载音响给用户带来听觉上的高阶体验，HUAWEI SOUND车载音响更是其中的佼佼者。凭借华为深厚的技术底蕴和持续的研发投入，将强大的声学技术与智能座舱应用场景精妙融合。无论

12月22日，上海——高保真至潮音频品牌JBL 携手品牌挚友伍鹏，在摩登地标淮海中路共同揭幕JBL TOUR PRO3音乐商务舱三代巨型耳机装置及限时快闪店，以震撼的视觉效果向消费者传递JBL耳机「天声敢出彩，就要超大声」的潮流宣言和对声音美学的极致追求。近期在巴黎大放异彩

——致态发布首款 PCIe 5.0旗舰产品顺序读取速度 14,000MB/S2024年12月24日，致态正式发布旗下首款PCIe 5.0旗舰存储产品——TiPro9000固态硬盘。TiPro9000首次采用基于长江存储新一代晶栈®Xtacking®4.0架构的闪存颗粒，搭配DRAM缓存及智能SLC缓存机制，顺序读取速度

一、前言在数字经济蓬勃发展的时代，数据已跃升为至关重要的生产资料。对于企业而言，数据的价值日益凸显，对业务连续性的需求也愈发迫切。因此，如何在确保数据安全的同时实现高效管理，已成为企业信息化建设不可或缺的前提和基础。在数智化进程中，容灾备份能够确保企

随着那个女人Mariah Carey的解冻进度即将来到100%，圣诞的气息已然蔓延在城市的各个角落，饱含节日氛围的歌曲为寒冬注入融融暖意。无论是耳熟能详的经典曲目，还是私人珍藏的小众歌单，什么才是这些圣诞BGM的正确打开方式?“为音乐而生”的索尼已经准备好了答案。LinkBu

今年，科大讯飞凭借其在语音智能科技领域的深厚积累，领衔的“多语种智能语音关键技术及产业化”项目获得2023年度国家科技进步奖一等奖。在此基础上，科大讯飞进一步发力，推出了安全性能显著提升、录音质量更加卓越的讯飞AI录音笔旗舰新品S8离线版。讯飞AI录音笔S8离线

12月16日，讯飞AI录音笔旗舰新品S8离线版重磅上市。该款产品为完全隔绝外界网络转文字AI录音设备，其所有功能均在本地实现，为对安全性有严格要求的用户群提供了新工具。数据泄露事件频发，信息保护需求凸显数字世界以网络连接为基础，以数据流动释放价值。在数字化浪潮

核心亮点：解锁电竞未来： ROG将于CES 2025 ROG新品发布会推出多项创新技术，彰显电竞实力超强产品阵容：探索为顶级性能释放和极致使用体验而打造的全新ROG新品笔记本终极性能：全新ROG枪神系列、ROG魔霸系列、ROG幻Air系列及幻X笔记本登场，为极致性能、便携性及潮流设

近日，以“科技赋能家电产业转型升级”为主题的2024中国家电科技年会在湖北武汉召开，海信空调受邀参加“家电噪声技术专题研讨会”，并作主题汇报。同时，“第三届全国轻工适老创新产品及智能健康解决方案大赛”结果隆重揭晓，海信空调以柔风、送风、智能等显著优势一举

时至十二月，又是一年终末。伴随着12.12的来临，厂商们纷纷开启了新一轮的促销优惠。作为年末备受期待的好物节，声势浩大的促销无疑是大家挑选心仪好物的好机会。如果你想在近期为自己选购一款智能手表来激励运动监测健康，不妨尝试一下最新的三星Galaxy Watch7和三星Ga

2024年进入尾声，国补政策即将在12月31日结束，还尚未使用笔记本国补资格的消费者朋友们不妨关注高颜值游戏本华硕天选5Pro锐龙版，其搭载GeForce RTX 4070笔记本电脑GPU，NVIDIA GeForce RTX™ 和 NVIDIA RTX™ GPU 专为 AI 时代打造。RTX GPU 由业界领先的 NVIDIA GPU

《使命召唤：黑色行动6》是由Treyarch和Raven Software联合开发，并由动视发行的第一人称射击游戏，于2024年10月25日正式发布。游戏上线Steam后，获得了广大玩家的好评。动视官方也宣称，《使命召唤：黑色行动6》成为《使命召唤》系列中首发最成功的作。在游戏正式发布

由GSC Game World开发并发行的《潜行者2:切尔诺贝利之心》已在STEAM正式上线,这是一款探索冒险题材的第一人称射击游戏。游戏以2006年第二次核反应堆爆炸事件为背景,玩家将化身为一名“潜行者”,面对一场史诗级的危险战斗。游戏首发即支持NVIDIA DLSS 3技术,搭载耕升 GeF

ROG游戏手机9系列自上市以来，赢得了不少信仰玩家的喜爱与支持，其凭借着出色的性能释放、独一档的185Hz屏幕刷新率，成为了手游爱好者们绝佳的上分利器。全新的矩阵式液冷散热架构9.0此次更是获得了酷冷风扇X Pro、ROG冰川液冷壳等全新配件的加持，使ROG 9系列获得了更

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区 · 齐鲁软件园鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.