3

Données massives vivantes

CAMBRIDGE – Les données massives découlent de la trace numérique que l’on laisse derrière soi lorsque l’on utilise cartes de crédit, téléphones portables ou que l’on consulte la toile électronique. Employées judicieusement et avec précision, ces données nous donnent une perspective sans précédent pour comprendre notre société et améliorer la façon dont nous vivons et travaillons. Mais ce qui fonctionne en théorie pourrait ne pas se traduire correctement dans le monde réel, là où les interactions humaines complexes ne peuvent pas toujours être saisies, même dans les modèles les plus complexes. Les données massives nous forcent à expérimenter à très grande échelle.

Mon propre laboratoire, par exemple, est en train de créer un site Web qui, sur la base de cartes Google, utilise les pistes numériques de la société pour cartographier les taux de pauvreté, de mortalité infantile, de criminalité et les changements dans le PNB et autres indicateurs sociaux, quartier par quartier, et qui peut être actualisé quotidiennement. Cette nouvelle fonctionnalité permet aux utilisateurs d’observer, par exemple, les endroits où les initiatives gouvernementales donnent des résultats et ceux où elles sont inopérantes.

Aleppo

A World Besieged

From Aleppo and North Korea to the European Commission and the Federal Reserve, the global order’s fracture points continue to deepen. Nina Khrushcheva, Stephen Roach, Nasser Saidi, and others assess the most important risks.

Évidemment, ces outils de visualisation si impressionnants peuvent grandement améliorer la transparence afin de mieux renseigner le public, mais ils sont remarquablement limités lorsqu’utilisés pour essayer de régler les problèmes de la société. L’une des raisons étant que ces sources de données incitent à faire des corrélations factices.

Même en utilisant la méthode scientifique habituelle, les résultats sont faussés, car avec tant de points de mesure et tellement plus de relations potentielles parmi tous ces liens jaugés, nos outils d’analyse statistique produisent des résultats dénués de sens. Sans avoir connaissance de toutes les possibilités, il est impossible d’élaborer un ensemble vérifiable d’hypothèses restreintes, tranchées et vérifiables. Puisque nous ne pouvons plus nous fier aux expériences en laboratoire pour une analyse de causalité, il faut donc le faire dans le monde réel, en utilisant des volumes massifs de données en temps réel. Ce qui veut dire qu’il faut aller au-delà de la procédure typique du laboratoire fondée sur le fait de poser des hypothèses et de les vérifier en vase clos. Nous devons appliquer nos concepts au sein même dans la société, plus en amont dans l’analyse à une plus grande fréquence que jamais auparavant.

Pour découvrir comment les choses fonctionnent vraiment dans la réalité, nous devons construire des laboratoires in vivo, dans des communautés disposées à essayer de nouvelles façons de faire (pour parler franc des collectivités prêtes à servir de cobaye). Un exemple d’un tel laboratoire est le projet de « données urbaines ouvertes » que j’ai lancé avec la ville de Trente en Italie, en collaboration avec Telecom Italia, Telefónica, l’université de recherche Fondazione Bruno Kessler, l’institut ID3 spécialisé dans la conception orientée par les données et des entreprises locales. Essentiellement, ce laboratoire vivant a reçu l’assentiment et le consentement éclairé de tous ceux qui y participent ; tous savent qu’ils prennent part à une expérience gigantesque dont le but est de créer un meilleur mode de vie.

Un défi majeur pour un laboratoire vivant est de protéger la confidentialité des informations des personnes sans diminuer le potentiel d’une meilleure gestion des affaires publiques. Le laboratoire de Trente, par exemple, pilotera mon projet du nouveau « contrat social sur les données » qui offre aux utilisateurs un plus grand contrôle sur leurs données personnelles par le truchement de logiciels de réseaux fondés sur la confiance tel que notre système ouvert de personnalisation des données des achats (PDS). Nous espérons que la capacité d’échanger des données en sûreté, tout en protégeant la confidentialité, encouragera les personnes, les entreprises et les instances à communiquer leurs idées afin d’augmenter la productivité et la créativité dans toute la ville.

Cependant, la plus grande difficulté d’utilisation des données massives pour la construction d’une meilleure société serait celle de développer des connaissances intuitives à échelle humaine de la physique des sociétés. Même si des données à haute densité continue et les techniques modernes de traitement informatique nous permettent de cartographier un grand nombre de détails sur notre société afin d’expliquer comment les communautés fonctionnent, ces modèles mathématiques bruts comportent un trop grand nombre de variables et de relations complexes pour que la plupart des gens puissent les comprendre.

Un dialogue est nécessaire entre l’intuition humaine et la réalité bien concrète des données volumineuses, dialogue d’ailleurs absent des systèmes actuels de gestion privés et publics. Pour que les données massives soient déployées efficacement, les gens doivent être en mesure de comprendre et d’interpréter les statistiques qui les concernent.

Support Project Syndicate’s mission

Project Syndicate needs your help to provide readers everywhere equal access to the ideas and debates shaping their lives.

Learn more

Ceci demande une nouvelle appréhension du comportement humain et des dynamiques sociales qui va bien au-delà des modèles économiques et politiques traditionnels. Ce n’est développant une nouvelle science et le nouveau vocabulaire de la physique des sociétés que nous serons en mesure de faire de l’univers des données massives un monde dans lequel nous voulons vivre.

Traduit de l’anglais par Pierre Castegnier