WEEKLY SERIES

INTERNATIONAL ECONOMICS

STRATEGIC SPOTLIGHT

GLOBAL FINANCE

ECONOMICS OF DEVELOPMENT

ECONOMIC AND REGULATORY POLICY

ECONOMIC HISTORY

ECONOMIC PERSPECTIVES

PUBLIC INTELLECTUALS

GLOBAL OUTLOOK

REGIONAL EYE

SPECIAL SERIES

PROJECT SYNDICATE

Science and Society

La búsqueda de calidad en la Red

English Spanish Russian French German Czech Chinese Arabic

2008-12-05

NUEVA YORK – En un futuro no muy lejano, los estudiantes se podrán graduar de la secundaria sin haber jamás abierto un libro. Hace veinte años, se podían graduar sin haber usado nunca un ordenador. En apenas unas cuantas décadas, la tecnología informática y la Internet han transformado los principios básicos de la información, el conocimiento y la educación.

De hecho, hoy puede usted tener más libros en el disco duro de su portátil que en una librería que ofrezca 60.000 títulos. Se dice que la cantidad de páginas Web en la Internet ha superado los 500 mil millones, suficientes como para llenar 10 portaaviones modernos con un número equivalente de libros de medio kilo y 500 páginas.

Estas analogías nos ayudan a visualizar la inmensidad de la explosión de la información y confirmar las inquietudes que la acompañan. Los motores de búsqueda de la Web son el único mecanismo con el que se puede navegar por esta avalancha de información, por lo que no se deben confundir con un accesorio optativo, uno de los botones con los que jugar, o una herramienta para encontrar la pizzería más cercana. Los motores de búsqueda son el punto de distribución más potente de conocimiento, riqueza y, sí, desinformación.

Cuando hablamos de búsquedas en la Web, el primer nombre que se nos viene a la mente es Google, por supuesto. No es exagerado decir que Google convirtió a la Internet en lo que es hoy en día. Dio forma a una nueva generación de personas notablemente distintas a sus padres. Los “baby boomers", o personas que nacieron tras la segunda guerra mundial, pueden ser los que estén en mejor posición de apreciarlo, ya que vivieron el Rock 'n’ Roll de jóvenes y Google cuando ya eran padres.

El diseño de Google se basó en algoritmos estadísticos, pero las tecnologías de búsqueda que se basan en ellos no pueden abordar el problema de la calidad de la información, simplemente porque la información de alta calidad no siempre es popular, y la información popular no siempre es de alta calidad. Uno puede reunir estadísticas hasta el hartazgo, pero no esperar que produzcan un efecto que vaya más allá de para lo que sirven.

Además, los sistemas de recolección de estadísticas se basan en material que antes debe estar ya disponible. Necesitan tiempo para que las personas hagan sus búsquedas y tiempo para reunir esa información. Por tanto, las nuevas publicaciones y las páginas dinámicas que cambian de contenido con frecuencia quedan fuera del alcance de los métodos de búsqueda por popularidad, y la búsqueda de este material es vulnerable a técnicas rudimentarias de manipulación.

Por ejemplo, las ineficiencias de los motores de búsqueda han creado una nueva rama de actividad llamada Optimización de Motores de Búsqueda, que se centra en estrategias para hacer que las páginas Web logren quedar en posiciones altas de los resultados que arrojan los criterios de popularidad de los motores de búsqueda que funcionan al estilo Google. Se trata de una industria de miles de millones de dólares. Si se tiene suficiente dinero, se puede hacer que una página Web quede en mejor lugar que otras más fiables o de mejor calidad. Desde el surgimiento de Google, la información de calidad nunca ha sido tan vulnerable al poder del mercantilismo.

La calidad de la información, moldeada a la sombra de las búsquedas Web, determinará el futuro de la humanidad, pero para asegurar la calidad será necesario un enfoque revolucionario, un radical avance tecnológico que vaya más allá de la estadística. Esta revolución está en camino, y se llama tecnología semántica.

La idea subyacente tras la tecnología semántica es enseñar a los ordenadores cómo funciona el mundo. Por ejemplo, cuando un ordenador encuentre la palabra “lista” sabría que tiene más de un significado en español. Cuando encuentre la frase "está lista la cena", deduciría que "lista" sólo puede ser un adjetivo equivalente a “preparada”.

Por el contrario, "La lista de Schindler" sólo sería el título de la película que lleva ese nombre. Al final, una serie de deducciones como ésa manejarían frases y párrafos completos para dar una representación precisa del significado del texto.

Para alcanzar este nivel de destreza en el manejo de un idioma mediante algoritmos informáticos, se debe crear una ontología, que no es ni un diccionario ni un tesauro. Es un mapa de conceptos interconectados que reflejan relaciones como las que existen entre los conceptos "lista" y "Schindler".

Crear una ontología que contenga el conocimiento del mundo puede ser una tarea inmensa que requiera un esfuerzo comparable a compilar una gran enciclopedia y la habilidad para generarla, pero es factible. Varias nuevas compañías en todo el mundo, como Hakia , Cognition Search y Lexxe han aceptado el desafío. Todavía está por verse el resultado de sus esfuerzos.

Sin embargo, ¿cómo solucionaría el problema de la calidad de la información un motor de búsqueda semántico? La respuesta es simple: precisión. Una vez que los ordenadores puedan manejar lenguajes naturales con precisión semántica, o será necesario que la información de alta calidad se vuelva popular antes de llegar al usuario final, a diferencia de lo que se necesita en las búsquedas de Web actuales.

La tecnología semántica promete otros medios de asegurar la calidad, mediante la detección de la riqueza y coherencia de los conceptos que encuentre en un texto dado. Si el texto incluye una frase como "Para tener lista a tiempo la cena de navidad", ¿incluye el resto del texto conceptos coherentes? ¿O se trata más bien una página indeseada que incluye un montón de titulares populares rodeados de avisos publicitarios? La tecnología semántica puede discernir qué es.

Considerando la limitada velocidad de lectura de los seres humanos (entre 200 y 300 palabras por minuto) y el enorme volumen de información disponible, para tomar buenas decisiones en la actualidad se necesita la tecnología semántica en cada aspecto de las áreas del conocimiento. No nos podemos permitir un futuro a merced de la popularidad y el dinero.

Riza Berkan es un científico nuclear especializado en inteligencia artificial, lógica difusa y sistemas de información. Es fundador de Hakia.

You might also like to read more from or return to our home page.

La reimpresión de material de este sitio Web sin el consentimiento por escrito de Project Syndicate es una violación de las leyes internacionales de derechos de autor. Para obtener autorización, póngase en contacto con distribution@project-syndicate.org.
English Spanish Russian French German Czech Chinese Arabic

You must be logged in to post or reply to a comment.
Please log in or sign up for a free account.