6月18-22日,全球计算机视觉及模式识别领域顶级学术会议CVPR 2018(Conference on Computer Vision and Pattern Recognition)在美国盐城湖召开,各国领先科技企业纷纷携研究成果来此展开一场精彩的“学术论剑”,其中不乏近年来在人工智能领域风生水起的中国企业。作为国内人工智能资深玩家,百度怎会缺席,不仅赞助了这届CVPR,还联合UC Berkeley和NVIDIA举办了唯一一场自动驾驶研讨会(Workshop on Autonomous Driving-WAD)。基于百度Apollo发布的大规模自动驾驶数据集ApolloScape展开的视频场景解析挑战赛(Video Segmentation Challenge) 可谓是本届CVPR的最受关注的挑战赛之一,吸引了全球145支高校和机构团队的极客们施展拳脚,而来自国内的旷视科技拿下了此项挑战赛的头名。
(自动驾驶研讨会联合主席,百度机器人与自动驾驶实验室负责人杨睿刚教授)
自动驾驶发展至今,世界范围内的合作、交流、资源共享越来越常见。这次,百度Apollo的自动驾驶研讨会也把众多学术界和业界叱咤风云的大咖们聚集在一起,围绕自动驾驶的未来发展、如何促进产学研合作、人才培养等问题展开探讨。来自Waymo,Lyft和Uber的演讲嘉宾们不约而同地将数据的重要性排在了第一,特别是不常见路况的采集和标注,比如堵车、路边开着门的车等等场景。
(自动驾驶研讨会现场照片, UIUC 教授 David Forsyth)
百度Apollo此次也聚焦在数据上,自动驾驶研讨会联合主席,百度机器人与自动驾驶实验室负责人杨睿刚教授在会上提到,在自动驾驶开发测试中,海量、高质的真实数据是必不可缺的“原料”。但是,少有团队有能力开发并维持一个适用的自动驾驶平台,长期的,系统的收集和标注新数据,因此行业亟需一个数据量充沛、标注详实的自动驾驶专用数据平台。所以今年3月份,百度正式发布了大规模自动驾驶数据集ApolloScape,百度Apollo参与这次CVPR大会的重点也是ApolloScape。
除了干货满满的研讨会,视频场景解析挑战赛也看点十足,145个国内外参赛队伍你追我赶,上线两个月来排行榜持续不断地刷新,堪称极客们的风云英雄榜。最终,来自旷视科技的队伍力压群雄,夺得桂冠。研讨会上,百度Apollo对优胜队伍进行了现场颁奖,其中获奖团队代表还发表了演讲。来自Nvidia的参赛队伍提出了来自ApolloScape的一些挑战,例如非常多的人和车,多样的光照条件,独特的围墙和三轮车类别等。更为重要的是,ApolloScape提供了大量视频标注和三维标注,怎样有效利用这些信息将会是自动驾驶科研的新挑战和机遇。来自旷视科技的参赛队伍在会后也提到了三维标注数据的重要性,随着三维信息越来越容易被获取,计算机视觉及模式识别领域里基于三维信息的检测、分割、跟踪、定位、重建等研究课题会越来越重要。
ApolloScape具备大规模测绘级别的, 稠密的,三维点云,尤其是每个点都被标注了语义信息,这是其他所有公开街景数据集所欠缺的。
旷视科技介绍他们的获奖工作
图像的语义标注是一项“苦力活”,需要耗费大量的财力和人力,因此能够用于语义分割的标注图像数据非常少。所以,评价一个自动驾驶数据集,不仅要看开放场景的多少,还要看被标注的图像数据量。据官方介绍,ApolloScape开放的像素级语义标注图像已有14.7万帧,其中包括感知分类和路网数据等数十万帧逐像素语义分割标注的高分辨率图像数据,以及与其对应的逐像素语义标注,未来还将进一步涵盖更复杂的环境、天气和交通状况,添加更多的传感器来扩充数据的多样性。有着一个业界巨头的长期支持,ApolloScape的开放对自动驾驶的学术研究和产业行业来说可以说是“久旱逢甘霖”。
百度Apollo在大会上还透露,ApolloSpace接下来将为数据集拓展更多类型、更多属性的数据:通过添加红外图像,帮助自动驾驶算法更容易进行夜间检测;提取更稠密的轨迹信息,用于对驾驶行为进行建模;以及通过众包模式采集立体视觉的驾驶特殊事件图像。此外,ApolloScape未来还将增加美国的相关数据。
发布1年多来,百度Apollo已经有了来自企业、高校、政府等领域的100多个合作伙伴。这次百度Apollo在国际顶级学术会议上施展拳脚也可以看出其在产学研多领域的重要影响力。