过去两年,为了向地球上还没有互联网接入的人提供接入方式,Facebook的一组工程师一直在开发能提供互联网接入的卫星、无人机和激光器。但要让这些东西起作用,首先应该做的是找到这些没有互联网接入的人所处的位置。而这需要一点人工智能。
2014年春季,Facebook推出了Connectivity Lab项目。目的是打造各种各样能够更为有效地将互联网延伸到世界其它地方的新技术——因此也能将Facebook延伸到世界其它地方。但这件事并不简单。就所需的时间、技术和金钱而言,建造飞行的互联网无人机(一种能在平流层巡航并将无线信号传输回地球的设备装置)是一个巨大的工程。
考虑到所需要的精力和费用,用无人机将信号发射到没有人的地区实在是说不过去。你可能觉得确定人们的位置是一件很容易的事。但地球很大。Facebook Connectivity Lab负责人Yael Maguire说:「我们意识到我们不能回答这个问题——而这是一个非常基本的问题。」地球上99%的地方没有人类生活。
所以Facebook转而寻求人工智能的帮助。Maguire和他的团队使用深度学习打造了一个全球地图,上面显示了怎样让他们的新互联网技术可以最高效地触及到世界上的人。Maguire说:「我们将用最好的技术建立一副地图。」
发送信号
通过借鉴该公司人工智能实验室(AI Lab)提供的服务,一位Facebook工程师兼光学物理学家Tobias Tiecke打造了一个可以自动分析地表的卫星图像并确认究竟什么地方有人生活的系统。Maguire解释说,该观点现在正指导着该公司的飞行无人机研制。事实上,他说, 这表明该公司原来用无人机提供互联网接入的方法是完全错误的。
深度学习依赖神经网络,即类似大脑神经元网络的硬件和软件网络。如果你向一个神经网络中输入足够多的山羊图片,它就能学会识别山羊。如果你向一个神经网络输入足够多的口语词汇,它就能学会识别你对智能手机说出的命令。以大致相同的方式,它也能分析卫星图像,并学会识别出有人类生活的地方。
为了使其能够工作,首先需要对数据进行标注。换句话说,人类必须在将样本输入神经网络之前确认出其中一些好的样本。比如在山羊图片的例子中,它们必须对一个山羊照片的样本集进行标记。Facebook的这个新项目的运作也是一样,但是有些许不同。人类训练者根本没有费力去标记文明存在的特定证据。它们没有标记房屋或汽车或道路或农场以将其作为训练神经网络的方式。对于样本照片,人类只是简单说明一下照片中是否有人类在此生活的迹象。「我们只是问:这张图片中是否有人造物?」Maguire说,「二选一的问题。是或否。」
在接受了相对较少的照片(约8000张在印度上空拍摄的图片)的信息之后,这个神经网络可以鉴别出拍摄自其它20个国家的照片中人类生活的证据。这个系统已总共分析了代表2160万平方千米地球土地的1560万张图片。使用上面提到二元问题的样本(8000张标记了是否包含人造物的照片),这个神经网络可以准确识别其它地方的其它人类造物。「只是基于那些信息,算法就能找出各种人造物,」Maguire说,并表示其错误率低于10%。
这种方法简单得有些让人惊讶。对Maguire来说无疑是惊喜。但深度神经网络有时就是这么让人惊讶。使用神经网络的目标是打造尽可能简单的分类器(classifier)——一种识别照片或口语词汇或其它数据的方式。「当你打造类似Facebook的那样的分类器时,你让神经网络做的分类越多,问题的难度就越大,无论是在计算还是在神经网络调节方面。」深度学习初创公司Skymind CEO兼创始人Chris Nicholson说,「所以,为了提高效率,你要为你所需的分类器的复杂度划定界线。Facebook选择做一些很简单的东西,但如果这些东西能实现他们的目标,也很好。」
最终,他们能在5米的精度上打造一幅标记了人造物的庞大地图。换句话说,他们基本上知道20个国家中每5平方米的区域内是否有人类生活的证据。然后,通过将这些信息和普查数据结合起来,他们可以得出这些国家的人口密度分布图。这非常强大。
此前Maguire及其团队假定每个无人机都能通过一个大型无线信号发射塔来覆盖一片区域。但Facebook人工智能强化过的地图表明这没有意义。「它从根本上改变了我们通信系统的发展方式。」Maguire说。他还没说该公司将打算如何改造它的无人机。但基本的想法是建造可被该公司用来直接定位人群的无线电台,而不只是通过巨大的无线信号发射塔覆盖一片区域。他说:「信号塔可以小很多。理想情况下,它们应该只覆盖有人的区域。事实上,那已经不是一个真正的信号塔了。」所以,Facebook现在已经知道了人们所在的位置,它也必须以新的方式建造自己的卫星、无人机和激光器。