随着疾病预测、世界杯预测的火爆,“大数据”成了每个IT圈人士张口闭口离不开的话题,好像一切都朝着苹果6的潮流发展——“bigger than bigger”,越大的就是越好的。随着大数据的不断应用创新,大数据预测日益被人们“神话”,100%准确率似乎成为了人们衡量大数据能力硬性指标,但事实并非如此。神乎其神的大数据预测有“显灵”一刻,也有“乌龙”一刻。今天小编就带领大家来盘点下大数据史上的关键时刻。
大数据史上的“神”预测
2009年,谷歌推出“流感趋势预测“项目,在甲型H1N1流感暴发的几周前,“谷歌流感趋势”成功预测了流感在美国境内的传播,其分析结果甚至具体到特定的地区和州,并且非常及时,令公共卫生官员备感震惊。此举一炮打响了谷歌在大数据预测的地位。
2014年,百度大数据预测团队通过对海量赛事信息的挖掘和分析,对2014年巴西世界杯全部64场比赛的胜负结果,以及冠军和黑马进行预测。无论是四分之一决赛还是16强淘汰赛,百度预测结果准确率都达到100%!斩高盛,赢谷歌,世界杯预测彻底火了百度。
在天气预测方面的“预测帝“是美国EarthRisk公司,该公司利用大数据对未来天气情况作出预报,它采用的预测模型项不同于以往的数值预报模式,可基于 820 亿次计算以及 60 年的气象历史数据来识别天气模式,然后将这些模式与当前的气候条件进行比较,再运用预测性分析进行天气预测,其预测时间更长、预测准度更高,最长可提前 40 天生成冷热天气概率。传统主观预测模型在EarthRisk面前简直是弱爆了。
大数据史上的”乌龙“预测
2011年至2013年间,谷歌流感趋势预测开始走下坡路,从2011年8月到2013年9月108周中,它高估了流感流行趋势超过50%。英国《自然》杂志报道称:在最近一次流感暴发中,“谷歌流感趋势”不起作用了!这个工具曾经可靠地运作了几个冬天,在海量数据分析和号称“不需要理论模型”的条件下,提供了快速、准确的流感暴发趋势。而这一次,谷歌产品显示的数据,与美国疾病控制中心汇总后的结果比起来,夸大了几乎一倍!项目多数高估了类流感发病率。
遭遇了流感预测的低谷,谷歌预测再逢强敌。在今年的世界杯预测,四分之一决赛前,百度、谷歌、微软和高盛就对世界杯四强进行了预测,结果显示,这一次百度、微软、高盛三家对结果进行了准确预测,而谷歌只准确预测到四强中的三支队伍。预测结果是否准确,预测模型的构建的作用十分关键,正是因为微软、高盛、百度、谷歌采用了不同的预测模型,才导致了它们之间预测结果的差异。与百度的高准确率相比,谷歌、微软、高盛恐怕要齐齐反思下这次的失误了。
可是,世界杯的余温刚刚散去,百度在9月底推出的电影票房预测首次试水也遭遇了小小的尴尬。在产品上线的内测阶段,百度预测《黄金时代》的票房为2.0~2.3亿,10月16日,《黄金时代》的累计票房为4698万(已上映16天),如此成绩对于片方、媒体和公众而言都是出乎意料,对于百度预测来说也是一次“乌龙”。
当今互联网行业发展风起云涌,“大数据”炙手可热。大数据预测的前提是承认其不确定性,有对有错,有成有败。我们不能因为某一次偏差,而全盘否定大数据的技术和成果。尽管这些项目目前暂时还存在缺陷,但这并不足以否定大数据对社会的潜在贡献。任何新生事物都有一个发展的过程。大数据预测功能在各行各业的价值,有些已经顺应天时地利而突显,有些还需假以时日才能达到人们理想中的要求。我们有理由相信大数据的未来价值也会和这时代潮流一样“bigger than bigger”。