3

活的大数据

美国剑桥—大数据来自我们使用信用卡、移动电话或网络后留下的数字痕迹。小心正确地使用这些数据能给我们带来前所未有的角度理解我们的社会,改善我们生活和工作的方式。但理论上有效并不意味着在现实世界中管用,在现实世界中,复杂的人际互动未必总能把握,即便你使用最现金的模型。大数据要求我们进行大规模实验。

比如,我自己的实验室正在建设基于谷歌地图的一个网站,该网站使用社会的数字痕迹勾勒贫困、婴儿死亡率、犯罪率、GDP变化和其他社会指标地图,并以社区为单位显示,每日更新。这一新功能能让访问者了解(比如)某地的政府计划是见效了还是失败了。

Chicago Pollution

Climate Change in the Trumpocene Age

Bo Lidegaard argues that the US president-elect’s ability to derail global progress toward a green economy is more limited than many believe.

但是,尽管这些令人瞩目的可视化工具能够极大地增加透明度和公共知识,但在被用于解决社会问题时,它们的作用仍然非常有限。一个原因是如此丰富的数据流引起了不可靠的相关性。

即使使用常规科学方法也不再管用;在测量指标众多和测量对象之间的潜在关系更多的情况下,我们的标准统计工具已无法产生有意义的结果。在不了解所有可能的替代方法的情况下,我们无法形成一个有限的、可检验的明确假说集。而如果我们能够不再依赖实验室实验检验因果关系,就必须在真实世界中使用大量实时数据进行检验。这需要超越封闭的、以提问-回答为顺序的典型的实验室过程,提早并以比从前任何时候更频繁地在社会中应用我们的思想。

为了了解现实中的事物怎样运行,我们必须构建生活实验室——即愿意尝试新方法做事的社区(能够直言,充当小白鼠)。一个生活实验室的例子是“开放数据城市”,这是我与意大利电信(Telecom Italia)、西班牙电信(Telefónica)、研究型大学Fondazione Bruno Kessler、数据驱动设计研究所(Institute for Data Driven Design)以及当地公司一起在意大利特兰托市(Trento)开展的实验。重要的是,这个生活实验室获得了所有参与者的知情同意和批准;他们都知道自己在参与一个巨型实验,目标是创造更好的生活方式。

生活实验室的一大主要挑战是保护个人隐私而不影响形成更好的政府的潜力。比如,特兰托实验将试点我提出的“数据新政”(New Deal on Data),用户将通过信任网络软件——如我们的开放PDS(个人数据存储)系统——得到对自身个人数据的更大的控制权。我们希望,在安全共享数据的同时保护隐私的能力能够鼓励个人、公司和政府广泛交流各自的想法,从而提高整个城市的生产率和创造力。

但使用大数据创造更好社会的最大困难是发展人体尺度的对社会物理学(social physics)的直观理解。尽管非常密集,但连续数据和现代运算能让我们勾勒社会的大量细节,而对于解释社区如何运转,这些原始数学模型包含太多的变量和复杂的关系,大部分人难以理解。

Fake news or real views Learn More

我们需要的是某种形式的人类直觉和大数据的令人信服的现实之间的对话——目前的管理和政府体系中缺少这种对话。要想有效部署大数据,人们就必须能够理解和解读相关统计数字。

这就需要对超越传统经济和政治模型的人类行为和社会动态做出新的理解。只有发展社会物理学的科学和语言,我们才能让大数据世界成为我们愿意生活其中的世界。