4

Quelle quantité de données suffira au développement ?

NAIROBI – La rapidité des avancées technologiques a permis de réduire considérablement le coût de la collecte des données. La présence de capteurs dans l’espace, dans l’atmosphère, en laboratoire et sur le terrain, de même que les nouvelles opportunités de crowdsourcing ainsi que l’adoption généralisée d’Internet et des téléphones mobiles, mettent à disposition de ceux qui jusqu’à présent n’y avaient pas accès une quantité colossale d’informations. Aujourd’hui, un petit exploitant agricole situé dans l’Afrique rurale peut ainsi accéder en une pression sur son écran aux prévisions météorologiques et aux cours du marché.

Cette révolution des données revêt un immense potentiel d’amélioration de la prise de décisions à tous les niveaux – du fermier local aux organisations de développement à l’échelle mondiale. Pour autant, la collecte de données ne suffit pas. Les informations doivent également être gérées et évaluées – ce qui, pour être effectué correctement, peut se révéler beaucoup plus complexe que la seule démarche de collecte des données. Lorsque les décisions qu’il convient d’améliorer ne sont pas consciencieusement identifiées et analysées au préalable, un risque majeur existe de voir gâchée ou mal exploitée une bonne partie de l’effort de collecte.

Aleppo

A World Besieged

From Aleppo and North Korea to the European Commission and the Federal Reserve, the global order’s fracture points continue to deepen. Nina Khrushcheva, Stephen Roach, Nasser Saidi, and others assess the most important risks.

Cette conclusion repose elle-même sur une analyse empirique. Rares sont par exemple les éléments de preuve faisant état d’un impact positif des initiatives de contrôle dans l’agriculture ou de gestion environnementale. L’analyse quantitative des décisions dans de nombreux domaines parmi lesquels la politique environnementale, les investissements d’affaires ou encore la cyber-sécurité, révèle que les individus ont tendance à surestimer la quantité de données nécessaire pour prendre une bonne décision, ou à ne pas saisir pleinement le type de données nécessaires.

Par ailleurs, de graves erreurs peuvent se produire lorsque de larges ensembles de données se trouvent gérés via l’utilisation d’algorithmes automatiques, sans examen préalable et approprié de la décision à prendre. On observe de nombreux cas dans lesquels le data mining a conduit à une conclusion erronée – y compris dans le cadre de diagnostics médicaux ou d’affaires judiciaires – précisément parce que les experts du domaine n’avaient pas été consultés, et parce que certaines informations critiques n’avaient pas été prises en compte dans l’analyse.

Les sciences décisionnelles, qui combinent la compréhension des comportements avec les principes universels d’un processus décisionnel cohérent, permettent de limiter ces risques en alliant les données empiriques et la connaissance des experts. Si nous entendons mettre la révolution des données au service du développement durable, les bonnes pratiques dans ce domaine devront être incorporées à la démarche.

La première étape consiste à identifier et à cadrer les décisions les plus fréquemment récurrentes. Dans le domaine du développement, ceci implique les décisions à grande échelle, telles que les priorités de dépense – et par conséquent les répartitions budgétaires – fixées par les gouvernements et les organisations internationales. Mais cette étape comprend également les choix effectués à une échelle plus réduite : quelle variété planter pour un agriculteur, quelle quantité d’engrais utiliser, à quel moment et à quel endroit vendre ses produits.

La deuxième étape consiste à élaborer un modèle quantitatif appréhendant les incertitudes de telles décisions, notamment les divers déclencheurs, conséquences, mécanismes de contrôle et d’atténuation, ou encore les différents coûts, avantages et risques en présence. Le fait d’incorporer – plutôt que d’ignorer – un certain nombre de facteurs difficiles à mesurer et extrêmement incertains permet de prendre de meilleures décisions.

Lorsqu’il est placé au service du développement durable, ce modèle impliquera bien souvent la prévision de l’impact des interventions sur les modes de subsistance et sur l’environnement à l’échelle de plusieurs décennies. Ce processus est le plus efficace lorsque des parties prenantes et autres experts sont recrutés afin d’identifier les variables pertinentes ainsi que la relation entre ces variables. Ces acteurs doivent ainsi être formés afin de formuler une estimation quantitative de leur incertitude concernant les différentes variables. Les experts peuvent par exemple estimer avec une confiance de 90 %, sur la base des données disponibles et de leur propre expérience, que le rendement moyen du maïs cultivé par les agriculteurs dans une région donnée s’élève à un niveau situé entre 0,5 et 2 tonnes par hectare.

La troisième étape consiste à calculer la valeur que revêt le fait d’obtenir des informations supplémentaires – une démarche qui n’est possible que lorsque les incertitudes de l’ensemble des variables ont été quantifiées. La valeur d’une information se mesure par la somme que serait prêt à payer un acteur décisionnaire rationnel pour l’obtenir. Il nous faut ainsi savoir lorsque des données supplémentaires auront une valeur susceptible d’améliorer une décision, et déterminer combien nous devrions dépenser pour les obtenir. Il peut arriver qu’aucune information supplémentaire ne soit nécessaire à la prise d’une décision avisée ; dans d’autres cas de figure, l’obtention de données supplémentaires peut valoir plusieurs millions de dollars.

Ce processus se répète jusqu’à ce que l’obtention de données ne confère plus de valeur supplémentaire, et qu’une décision avisée puisse être prise – en tant que conclusion logique, fondée sur les informations, les valeurs et les préférences des acteurs décisionnaires ou de l’entité effectuant la décision. Ceci confère aux décideurs et aux parties prenantes un certain nombre d’éclairages sur la manière d’améliorer les politiques afin de maximiser les résultats positifs et de réduire les risques, tels que la possibilité de faibles taux d’adoption, ou de capacités institutionnelles limitées par rapport à une mise en œuvre efficace.

Support Project Syndicate’s mission

Project Syndicate needs your help to provide readers everywhere equal access to the ideas and debates shaping their lives.

Learn more

Il ne suffit pas de présupposer que la révolution des données bénéficiera au développement durable. Pour que cela soit le cas, il s’agira de reconnaître l’importance d’une analyse rigoureuse à chaque étape de la collecte des données, ainsi que de la formation d’une nouvelle génération de scientifiques décisionnels travaillant aux côtés des dirigeants politiques.

Traduit de l’anglais par Martin Morel