3

Živá „velká data“

CAMBRIDGE – Velká data (big data) tvoří digitální stopy, jež za sebou zanecháváme při používání kreditních karet, mobilních telefonů či webů. Když se tato data obezřetně a vhodně využijí, dají nám bezprecedentní příležitost porozumět společnosti a zlepšit způsob, jímž žijeme a pracujeme. Co však funguje teoreticky, nemusí se úplně správně projevit ve skutečném světě, kde ani nejdůmyslnější modely nedokážou vždy podchytit spletité interakce lidí. Velká data vyžadují, abychom ve velkém experimentovali.

Laboratoř, již řídím, vytváří například web, založený na mapách Google, který digitálních stop společnosti využívá k mapování chudoby, dětské úmrtnosti, zločinnosti, změn HDP a dalších společenských ukazatelů, okres od okresu, obvod od obvodu – to vše s každodenní aktualizací. Tato nová vymoženost návštěvníkům umožňuje například sledovat, kde vládní snahy zabírají a kde jsou neúspěšné.

Přestože však takové působivé nástroje vizualizace mohou podstatně posílit transparentnost a informovanost veřejnosti, při využití k řešení společenských problémů jsou kupodivu omezené. Jeden důvod tkví v tom, že tak bohaté toky dat stimulují falešné korelace.

Ani nasazení běžných vědeckých metod se neosvědčuje; vzhledem k vysokému počtu měření a ještě vyššímu počtu potenciálních vazeb mezi měřenými údaji přinášejí naše běžné statistické nástroje nesmyslné výsledky. Bez znalosti všech možných alternativ nemůžeme vytvořit omezený, pokusy ověřitelný soubor jasných hypotéz. A jestliže už tedy při testování kauzality nemůžeme spoléhat na laboratorní experimenty, musíme ji ověřovat ve skutečném světě, pomocí rozsáhlých objemů dat získávaných v reálném čase. K tomu je zapotřebí vykročit za hranice uzavřeného procesu otázek a odpovědí, typického pro laboratoře, a aplikovat ideje ve společnosti, a to dřív a častěji než doposud.

Abychom viděli, jak věci reálně fungují, musíme vytvořit živé laboratoře – komunity ochotné zkoušet nové postupy (řečeno neomaleně, posloužit jako pokusní králíci). Příkladem takové živé laboratoře je „město otevřených dat,“ které jsem zahájil s italským Tridentem, ve spolupráci se společnostmi Telecom Italia a Telefónica, výzkumnou univerzitou Fondazione Bruno Kessler, organizací Institute for Data Driven Design a místními firmami. Důležité je, že tato živá laboratoř má podporu a poučený souhlas všech zúčastněných; chápou, že se účastní gigantického experimentu, jehož cílem je vytvořit lepší způsob života.

Jednou významnou výzvou pro živou laboratoř je ochránit soukromí jedinců, aniž by to snížilo potenciál k lepší správě. Tridentská laboratoř například testuje mnou navrženou „Novou dohodu o datech,“ která dá uživatelům víc kontroly nad jejich soukromými daty prostřednictvím softwaru vytvářejícího sítě důvěry, jako je náš otevřený systém PDS (Personal Data Store). Doufáme, že možnost bezpečně sdílet data a zároveň si chránit soukromí povzbudí jedince, firmy i vlády, aby otevřeně předkládali své ideje a tím zvýšili produktivitu a kreativitu v celém městě.

Největší těžkostí při využívání velkých dat k budování lepší společnosti je být schopen vytvořit intuitivní výklad sociální fyziky v lidském měřítku.Přestože nám hustá, kontinuální data a moderní výpočetní technika umožňují sledovat mnoho detailů o společnosti a vysvětlit, jak by komunity mohly fungovat, takové syrové matematické modely obsahují příliš mnoho proměnných a složitých vazeb, a jsou proto pro většinu lidí nepochopitelné.

Potřebujeme určitý dialog mezi lidskou intuicí a přesvědčivou realitou velkých dat – dialog, jejž správní a vládní soustavy v současnosti postrádají. Máme-li velká data efektivně zužitkovat, lidé musí být schopni porozumět příslušným statistikám a umět je interpretovat.

To vyžaduje nový výklad lidského chování a sociální dynamiky, který půjde za hranice tradičních ekonomických a politických modelů. Jedině rozvojem poznatků a jazyka sociální fyziky budeme schopni udělat ze světa velkých dat svět, ve kterém chceme žít.

Z angličtiny přeložil David Daduč