(来源:中国科学院科技战略咨询研究院 2016-10-10)
8月19日,《科学》杂志发表了斯坦福大学研究团队关于《卫星影像和机器学习相结合预测贫困》研究成果文章[1],通过将卫星数据与流畅的机器学习相结合,研发出了能准确地估计家庭消费与收入的方法。
发展中国家经济生活的可靠数据仍然非常稀缺而且也难以获得,但对于向研究和政策提供信息而言又十分重要。例如,世界银行的数据显示,非洲59个国家中有39个在2000年到2010年间仅完成了不到两次与贫困相关的人口调查,这些国家中有14个完全没有做过任何调查,而且大部分已经收集到的数据也永远不会公开。几十年来,研究人员一直都在使用其它替代数据集来测度贫困,比如社交媒体、网络搜索查询和移动网络使用量等。
由斯坦福大学经济学家Marshall Burke率领的社会学家和计算机科学家研究团队对卫星日间图像进行了筛选,首先得到目标变量是已知的数据集,在这种情况下通常为人均收入。随后,在这些数据子集的基础上训练计算机,从而创建统计模型,能够预测其余数据中的隐藏变量。
该研究提出了一种准确、廉价、且可扩展的用于从高分辨率卫星图像中评估消费支出和资产财富的方法,即利用来自5个非洲国家(尼日利亚、坦桑尼亚、乌干达、马拉维和卢旺达)的调查和卫星数据,然后发现了通过卷积神经网络如何被训练识别图像的功能,可以解释当地多达75%的经济结果。该方法仅需要公开可用的数据,可以改变追踪和定位发展中国家贫困的方式。这也说明了强大的机器学习方法可以如何被用于只有有限训练数据的环境中,该方法在许多科学领域都有广泛的应用潜力。
(王宝)
[1] Combining satellite imagery and machine learning to predict poverty. http://science.sciencemag.org/content/sci/353/6301/790.full.pdf