Después de bastante tiempo se vuelve a hablar de web semántica, esta vez como Web 3.0. El problema original, simplificando un poco, es que la WWW tal como hoy la conocemos no es la que Tim Berners-Lee tenÃa en mente: las páginas HTML tienen el inconveniente de mezclar datos (completamente desestructurados) y con el modo en que estos se presentan en pantalla, además de carecer de semántica; texto y más texto entre etiquetas que le dicen al navegador como “pintarlo” pero no si se trata de un currÃculum, un evento o una carta de amor. La idea era añadir metadatos (datos sobre los datos) a la información en la web para aportar semántica, pero ninguna aproximación a esto ha cuajado. Y es por ello que seguimos teniendo buscadores torpes, que se confunden y es tan complicado agregar información por su temática de forma automática.
Y en estas que aparecen los microformatos. Los microformatos no son sino convenciones a la hora de publicar contenido web, pequeños bloques en las que se aporta semántica a lo publicado. Un ejemplo podrÃa ser el microformato hcard, que no es sino un formato para representar los datos de una persona, una organización o un lugar y que se puede “embeber” dentro del (X)HTML, Atom o RSS. Esto es importante, los microformatos no son ficheros aparte de nuestro contenido web, como sà lo son los canales de sindicación. Otro ejemplo de microformato son los “tags” Technorati, el no follow o hCalendar para información de calendarios o eventos.
¿Para qué sirve utilizar microformatos?
Pues para que cualquier proceso automático pueda indexar la información de una forma mucho más sencilla y precisa. Pensemos en una revisión de un producto, por ejemplo una pelÃcula ¿puede saber un buscador o el navegador que estamos hablando de ella? A priori no es complicado, buscando el nombre de la misma en el tÃtulo de la página web y su contenido ¿puede saber quién hizo la revisión, cuándo y que valoración tiene de la misma? Más complicado, las mejores tecnologÃas de búsqueda tienen muchos errores porque no hay nada en html que le de esta “semántica”. Ahora bien, si como editores hubiésemos utilizado el microformato hReview, todo se habrÃa conseguido de forma automática. Otro ejemplo serÃa el proyecto Live Clipboard paar el “copia y pega en la web” de Microsoft, que está bastante animosa apoyando los microformatos.
¿Cómo utilizarlos?
De nada servirÃan los microformatos si no se integran en los gestores de contenidos. No se trata, por supuesto, de andar editando el html y añadiendo estructuras complejas para “no geeks”, se trata de que WordPress y el resto de software para crear sitios tengan integrados los microformatos. Pensemos que todos los blogs de cine y los foros los utilizaran integrados en el formulario para escribir, serÃa posible armar un buscador capaz de saber la nota recibida por una pelÃcula por la blogosfera y los foreros. Incluso un servicio que me permitiese escoger a mis crÃticos de cabecera y en función de lo que ellos hayan votado, me recomendase pelÃculas. Todo descentralizado, lo bueno de los microformatos es que dan el poder al editor sobre la organización de la información que publican. Eso sÃ, nada salva a este tipo de procesos de páginas artificiales que quisieran enviarles “spam”.
Conclusión
Es complicado que veamos a corto plazo los ambiciosos planes de web semántica, con las ontologÃas y el RDF, pero sà creo que los microformatos van a ayudar a estructurar algo la información y a aportar semántica. Son una aproximación modesta comparado con lo que se querÃa conseguir, pero encaja en la web tal y como hoy la entendemos.
Los anuncios por parte de que Firefox 3.0 y Explorer 8 los soportarán son el espaldarazo final que se necesitaba, pero hay muchas otras iniciativas alrededor de ellos como es Pingerati, un buscador realizado por Technorati basado en microformatos. Tiene todo el sentido su apuesta: un buscador basado en microformatos necesita muchos menos recursos a la hora de analizar la información que aquél que bucea en información desestructurada.
Más información en:
Yahoo ya está haciendo uso de los microformatos para formatear sus resultados. Pronto le seguirá Google y probablemente pronto se ponga de moda. Creo que cada ada vez está más claro que la web semántica es el futuro. Gracias a los microformatos se podrá reaprovechar la información existente para hacer cosas cada vez más grandes gracias a que las webs ofrecerán más datos sobre las caracterÃsticas y la tipologÃa de su información.