El futuro son los microformatos
Después de bastante tiempo se vuelve a hablar de web semántica, esta vez como Web 3.0. El problema original, simplificando un poco, es que la WWW tal como hoy la conocemos no es la que Tim Berners-Lee tenía en mente: las páginas HTML tienen el inconveniente de mezclar datos (completamente desestructurados) y con el modo en que estos se presentan en pantalla, además de carecer de semántica; texto y más texto entre etiquetas que le dicen al navegador como "pintarlo" pero no si se trata de un currículum, un evento o una carta de amor. La idea era añadir metadatos (datos sobre los datos) a la información en la web para aportar semántica, pero ninguna aproximación a esto ha cuajado. Y es por ello que seguimos teniendo buscadores torpes, que se confunden y es tan complicado agregar información por su temática de forma automática.
Y en estas que aparecen los microformatos. Los microformatos no son sino convenciones a la hora de publicar contenido web, pequeños bloques en las que se aporta semántica a lo publicado. Un ejemplo podría ser el microformato hcard, que no es sino un formato para representar los datos de una persona, una organización o un lugar y que se puede "embeber" dentro del (X)HTML, Atom o RSS. Esto es importante, los microformatos no son ficheros aparte de nuestro contenido web, como sí lo son los canales de sindicación. Otro ejemplo de microformato son los "tags" Technorati, el no follow o hCalendar para información de calendarios o eventos.
¿Para qué sirve utilizar microformatos?
Pues para que cualquier proceso automático pueda indexar la información de una forma mucho más sencilla y precisa. Pensemos en una revisión de un producto, por ejemplo una película ¿puede saber un buscador o el navegador que estamos hablando de ella? A priori no es complicado, buscando el nombre de la misma en el título de la página web y su contenido ¿puede saber quién hizo la revisión, cuándo y que valoración tiene de la misma? Más complicado, las mejores tecnologías de búsqueda tienen muchos errores porque no hay nada en html que le de esta "semántica". Ahora bien, si como editores hubiésemos utilizado el microformato hReview, todo se habría conseguido de forma automática. Otro ejemplo sería el proyecto Live Clipboard paar el "copia y pega en la web" de Microsoft, que está bastante animosa apoyando los microformatos.
¿Cómo utilizarlos?
De nada servirían los microformatos si no se integran en los gestores de contenidos. No se trata, por supuesto, de andar editando el html y añadiendo estructuras complejas para "no geeks", se trata de que Wordpress y el resto de software para crear sitios tengan integrados los microformatos. Pensemos que todos los blogs de cine y los foros los utilizaran integrados en el formulario para escribir, sería posible armar un buscador capaz de saber la nota recibida por una película por la blogosfera y los foreros. Incluso un servicio que me permitiese escoger a mis críticos de cabecera y en función de lo que ellos hayan votado, me recomendase películas. Todo descentralizado, lo bueno de los microformatos es que dan el poder al editor sobre la organización de la información que publican. Eso sí, nada salva a este tipo de procesos de páginas artificiales que quisieran enviarles "spam".
Conclusión
Es complicado que veamos a corto plazo los ambiciosos planes de web semántica, con las ontologías y el RDF, pero sí creo que los microformatos van a ayudar a estructurar algo la información y a aportar semántica. Son una aproximación modesta comparado con lo que se quería conseguir, pero encaja en la web tal y como hoy la entendemos.
Los anuncios por parte de que Firefox 3.0 y Explorer 8 los soportarán son el espaldarazo final que se necesitaba, pero hay muchas otras iniciativas alrededor de ellos como es Pingerati, un buscador realizado por Technorati basado en microformatos. Tiene todo el sentido su apuesta: un buscador basado en microformatos necesita muchos menos recursos a la hora de analizar la información que aquél que bucea en información desestructurada.
Más información en: