Freebase y la Web Semántica

mar 10, 2007

¿Cuántas veces nos han vendido web semántica como si su llegada fuese inminente y dento de un par de días los buscadores comenzasen a ser más inteligentes? La verdad es que demasiadas para que al cabo del tiempo estemos añadiendo etiquetas a los contenidos y con unas esperanzas prudentes en los microformatos. Y en estas llega una start-up llamada Metaweb Technologies que con un producto al que han llamado Freebase afirma aspirar a crear una base de datos centralizada que almacene toda la información digital del mundo, accesible de forma gratuita. Tras salir en el NYT, ha generado una catarsis de comentarios.

Freebase va por tanto de habilitar una gigantesco y gratuito repositorio con información obtenida de las distintas base de datos de internet (musicbrainz, Wikipedia), estructurándola de forma que permita a agentes software (buscadores) detectar relaciones y obtener metainformación semántica que sería generada por los usuarios. Para hacernos una idea, Tim O'Reilly tiene un artículo explicando el funcionamiento de Freebase con capturas. A la hora de buscar información sobre una empresa, Freebase muestra la entrada correspondiente en la WikiPedia y una foto (añadida por un usuario), pero lo más importante es que está categorizada como empresa y tiene una estructura de datos asociada en función de ello (aparecen fundador, número de empleados, eslogan...). Esos datos son los aportados por los usuarios al estilo Wikipedia. La gracia del inventos es la estructura, lo que hace a la información no sólo accesible, sino también consultable por un agente software.

La web ya es de por sí una base de datos gigantesca con los contenidos relacionados (los enlaces) pero la información no está estructurada sino que se encuentra mezclada con la presentación (en el HTML). El sueño de una web semántica con información estructurada que tenga además metadatos sobre su significado es tan antiguo como la propia red de redes. Lo que aporta de nuevo Freebase es basarse en un concepto muy "Web 2.0", que sean los propios usuarios los que completen estos metadatos para crear la gran base de datos centralizada como quien colabora con la Wikipedia, justo el camino opuesto a lo planteado hasta ahora por la W3C y RDF para describir relaciones en una web semántica distribuida. Hasta ahora lo más similar a este planteamiento ha sido Google Base y como primera dificultad, Freebase tiene la necesidad de convencer a los usuarios para que colaboren con el proyecto y que lo hagan bien.

La idea me gusta, de tener éxito puede ser muy útil y el que vayan a tener una licencia libre los contenidos de Freebase, también. Menos agradable me resulta el centralizar en manos de esta compañía, Metaweb Technologies, toda la información, aunque la propia licencia de los contenidos permitirá hacer copias (espero). En cualquier caso, una interesante aproximación a lo que puede ser el futuro de la web: contenidos generados por los usuarios y web semántica.

Error500

Discusión sobre este post