1 月 8 日消息,在 CES 2022 期间,Mobileye 宣布,目前已采集了 200PB 的数据。这一庞大的汽车数据集包含了过去 25 年中超过 200 PB 的真实环境驾驶视频素材,共 1600 万个 1 分钟视频片段。
Mobileye 表示,这些数据配合 Mobileye 的计算机视觉技术和自然语言理解(NLU)模型使用,即使是罕见条件和场景下的“长尾”事件,仍可以在几秒钟内输出数千个结果。这有助于自动驾驶汽车和计算机视觉系统处理边缘情况,从而让自动驾驶汽车实现更高的平均故障间隔时间(MTBF)。
▲ Mobileye 数据集
Mobileye 数据集由 2500 多名标注人员手动标注或自动标注。该计算引擎依靠云服务器中的 50 万个峰值 CPU 内核,每月处理 5000 万个数据集 —— 相当于每月处理由 50 万小时的驾驶素材所生成的 100 PB 数据。
Mobileye 团队使用内部搜索引擎数据库,其中包含数百万张图片、视频片段和场景。内容覆盖面极广,从“被雪覆盖的拖拉机”一直到“夕阳下的交通信号灯”,这些均由 Mobileye 采集并馈入其算法。
▲ Mobileye 数据集包含数百万张图片、视频片段和场景