4

多少发展数据算够?

内罗毕—科技的迅速进步极大地降低了收集数据的成本。太空、天空、实验室和实地传感器,以及新兴的众包机会和已得到广泛使用互联网和移动电话正在让人们获得从前无从获得的巨量信息。比如,如今非洲农村地区的小农轻点屏幕就可以了解天气预报和市场价格。

数据革命为改善个层面决策提供了巨大的潜力——不论是本地农民还是业务遍布全球的发展组织。但光是收集数据是不够的。还必须管理和评估信息——合理地完成这一任务可能远比收集数据更复杂、更昂贵。如果需要改善的决策从一开始无法得到合理的识别和分析,就极有可能让巨大的集体努力付诸东流或出现方向性错误。。

 1972 Hoover Dam

Trump and the End of the West?

As the US president-elect fills his administration, the direction of American policy is coming into focus. Project Syndicate contributors interpret what’s on the horizon.

这一结论本身便是基于实证分析。比如,监测农业或环境管理项目能带来积极影响,这一观点的支持证据很弱。多个领域——包括环境政策、商业投资和网络安全——的量化决策分析表明,人们倾向于高估做出好决策所需要的数据量或误解需要的数据类型。

此外,如果只使用机器算法挖掘大数据集而不首先合理地考察需要作出的决策,就可能谬以千里。数据挖掘导致错误结论的情况不胜枚举——包括用药剂量和法律案例——原因是没有咨询相关领域的专家,导致关键信息被排除在分析之外。

决策科学将人们对行为的理解与一致决策的基本原理相结合,它能够让实证数据与专家知识相匹配,从而降低这类风险。如果我们想让数据革命有利于可持续发展,那么就必须将该领域的最佳实践纳入。

第一步是识别和框定频繁循环决策。在发展领域,这些决策包括大规模决策,如政府和国际组织的支出重点——从而决定预算配置。但也包括规模小得多的选择:农民要决定种植哪种庄稼、使用多少肥料,何时以及在哪里出售收成。

第二步是在这些决策中建立不确定性的量化模型,包括各种触发因素、后果、控制因素和缓和因素,以及其中所牵涉到的不同成本、收益和风险。纳入——而不是忽略——难以测量、高度不确定的因素才能带来最佳决策。

在可持续发展方面,这类模型常常包括预测未来数十年中干预对生计和环境的影响。这一过程要想获得成功,就必须让相关利益方和专家一起梳理重要变量和它们之间的关系。这些参与者必须受过训练,能够提供不同变量的不确定性的量化估计。比如,基于可获得的数据和自身经验,专家可能以90%的置信度估算出某给定区域的农民平均玉米收成为每英亩0.5—2吨。

第三步是计算获取更多信息的价值——只有在所有变量的不确定性都得到量化之后,这一步才有可能实现。信息的价值等于理性决策者愿意为此付出多少钱。因此,我们需要知道新增信息对于改进决策的价值在哪里,以及我们应该花多少钱获得它。在某些情况中,做出可靠决策不需要更多的数据;但在另一些情况中,获得更多数据可谓价值连城。

Fake news or real views Learn More

这一过程会反复进行,直到获得信息已再无价值,并且可靠的决策已经达到。可靠的决策是指基于信息、价值和决策者或决策机构的偏好所做出的合乎逻辑的结论。它向决策者和相关利益方提供关于如何改善政策从而最大化积极结果并降低风险(比如发生低通过率的可能性或机构缺乏有效实施的能力)的洞见。

简单地认为数据革命一定有利于可持续发展是不够的。确保这一结果需要认识到严格分析在每一次数据收集工作中的重要性,以及培养新一代决策科学家与决策者合作的重要性。