NEW YORK – Vamp#160;nepříliš vzdálené budoucnosti budou studenti schopni odmaturovat, aniž by kdy vzali do ruky knihu. Před dvaceti lety mohli složit maturitu, aniž by kdy použili počítač. Během pouhých několika desítek let proměnila výpočetní technika a internet stěžejní principy informací, vědomostí i vzdělávání.
Už dnes se vám na harddisk přenosného počítače vejde víc knih než do knihkupectví, kde leží 60 tisíc titulů. Říká se, že počet webových stránek na internetu překročil 500 miliard, což by stačilo na zaplnění deseti moderních letadlových lodí odpovídajícím množstvím 500stránkových, půlkilových knih.
Takové analogie nám pomáhají představit si nesmírnost informační exploze a potvrdit obavy, které samp#160;ní přicházejí. Jediným mechanismem, který nám pomáhá se touto záplavou informací prodírat, jsou vyhledávače, takže bychom si je neměli plést samp#160;volitelnými doplňky, tlačítkem používaným pro zpestření ani samp#160;nástrojem kamp#160;nalezení nejbližší pizzerie. Vyhledávače jsou naprosto nejmocnější rozvodny vědomostí, bohatství a ovšem též dezinformací.
Když hovoříme o prohledávání webu, první jméno, které vytane na mysli, je samozřejmě Google. Není přehnané, když řekneme, že Google dal internetu jeho dnešní podobu. Vyprofiloval novou generaci lidí, kteří se pozoruhodně liší od svých rodičů. Silné poválečné ročníky to asi dokážou pochopit nejlíp, protože jako děti zažili rock ’n’ roll a jako rodiče Google.
Koncepce Googlu se zakládá na statistických algoritmech. Techniky vyhledávání založené na takových algoritmech ale nedokážou zohledňovat kvalitu informací, prostě proto, že informace vysoké jakosti nejsou vždycky populární a populární informace zase nejsou vždycky vysoce jakostní. Statistické údaje lze shromažďovat do aleluja, ale nemůžete očekávat, že statistika přinese účinek jdoucí za hranice toho, kamp#160;čemu se hodí.
Systémy sběru statistických údajů jsou navíc obráceny do minulosti. Potřebují čas, aby lidé vytvořili odkazy, a další čas, aby je sesbíraly. Nové publikace a dynamické stránky, které svůj obsah často mění, jsou tudíž už teď mimo dosah metod založených na popularitě a hledání takových materiálů lehce podléhá primitivním technikám manipulace.
Nedostatky dnešních vyhledávačů například daly vzniknout nové branži nazývané optimalizace pro vyhledávače, která se zaměřuje na strategie, které webovým stránkám zajistí přední umístění podle kritérií popularity používaných googlovskými vyhledávači. Vamp#160;této branži se protočí miliardy dolarů. Máte-li dost peněz, vaše webová stránka se může dostat na vyšší pozici než mnoho jiných, které jsou věrohodnější nebo kvalitnější. Kvalita informací ještě nikdy nebyla tak náchylná kamp#160;moci komercializace jako od nástupu Googlu.
Jakost informací, formovaná vamp#160;přítmí vyhledávání na webu, bude rozhodovat o budoucnosti lidstva, ale zajištění kvality si vyžádá revoluční přístup, technologický průlom za hranice statistiky. Tato revoluce už probíhá a říká se jí sémantická technika.
Stěžejní myšlenkou sémantické techniky je naučit počítače rozumět tomu, jak svět funguje. Tak například když by počítač narazil na slovo „bill“, věděl by, že „bill“ má vamp#160;angličtině 15 významů. Když by se setkal se slovním spojením „killed the bill“, usoudil by, že „bill“ tu může znamenat jedině navrhovaný zákon předložený zákonodárnému sboru a že „kill“ může znamenat jedině „zastavit“.
Naproti tomu „kill bill“ by znamenalo jedině název filmu tohoto jména. Nakonec by se série dedukcí tohoto typu vypořádala samp#160;celými větami a odstavci, aby byla věrně zachycena vazba textu a smyslu.
Abychom dosáhli takové obratnosti při zpracování jazyků počítačovými algoritmy, je zapotřebí vybudovat ontologii. Ontologie není ani slovník ani tezaurus. Je to mapa vzájemně propojených pojmů a slovních významů, která reflektuje vztahy, jako jsou ty, které existují mezi pojmy „bill“ a „kill“.
Vytvořit ontologii, která shrne světové znalosti, může být sice obrovský úkol, který si vyžádá jednak úsilí srovnatelné se sestavováním rozsáhlé encyklopedie, jednak potřebné odborné znalosti, ale je to uskutečnitelné. Několik mladých společností zamp#160;různých částí světa, například Hakia , Cognition Search a Lexxe , se této výzvy ujalo. Jaký výsledek tyto snahy přinesou, se teprve uvidí.
Jak by ale sémantický vyhledávač řešil problém kvality informací? Odpověď je snadná: přesností. Jakmile počítače dokážou zpracovat přirozené jazyky se sémantickou přesností, vysoce jakostní informace nebudou muset být populární, aby se dostaly ke konečnému uživateli, na rozdíl od toho, co vyžaduje současné hledání na webu.
Sémantická technika slibuje další prostředky kamp#160;zajištění kvality, neboť rozpozná bohatost a soudržnost pojmů, samp#160;nimiž se setká vamp#160;textu. Jestliže text obsahuje například pojení „Bush zarazil poslední návrh zákona vamp#160;senátu“, objevují se ve zbytku textu související pojmy? Nebo se jedná o nekalou stránku obsahující řadu populárních frází obklopených reklamami? Sémantická technika dokáže rozpoznat, o co tu jde.
Vzhledem kamp#160;omezené rychlosti čtení u člověka (200 až 300 slov za minutu) a nesmírnému objemu dostupných informací si dnes efektivní rozhodování žádá sémantické techniky ve všech aspektech tříbení vědomostí. Nemůžeme si dovolit budoucnost, vamp#160;níž bude vědění vydáno na milost a nemilost popularitě a penězům.


Comments (0)
You need to login in order to leave a comment. If you do not yet have an account, please register.
The two commenting options explained
Watch a 1 minute video
to discover how you can comment on the entire article or a specific paragraph. The two images below also explain the two ways of commenting.
1) Entire article comment
Once logged in, simply click inside the comment box where it says "Enter text here." Enter and post your comment.
2) Paragraph comment
Please log in first. Then click to the left of the desired paragraph. Your cursor will automatically move to the comments box. Enter and post your comment.