El futuro son los microformatos

microformatosDespués de bastante tiempo se vuelve a hablar de web semántica, esta vez como Web 3.0. El problema original, simplificando un poco, es que la WWW tal como hoy la conocemos no es la que Tim Berners-Lee tenía en mente: las páginas HTML tienen el inconveniente de mezclar datos (completamente desestructurados) y con el modo en que estos se presentan en pantalla, además de carecer de semántica; texto y más texto entre etiquetas que le dicen al navegador como "pintarlo" pero no si se trata de un currículum, un evento o una carta de amor. La idea era añadir metadatos (datos sobre los datos) a la información en la web para aportar semántica, pero ninguna aproximación a esto ha cuajado. Y es por ello que seguimos teniendo buscadores torpes, que se confunden y es tan complicado agregar información por su temática de forma automática.

Y en estas que aparecen los microformatos. Los microformatos no son sino convenciones a la hora de publicar contenido web, pequeños bloques en las que se aporta semántica a lo publicado. Un ejemplo podría ser el microformato hcard, que no es sino un formato para representar los datos de una persona, una organización o un lugar y que se puede "embeber" dentro del (X)HTML, Atom o RSS. Esto es importante, los microformatos no son ficheros aparte de nuestro contenido web, como sí lo son los canales de sindicación. Otro ejemplo de microformato son los "tags" Technorati, el no follow o hCalendar para información de calendarios o eventos.

¿Para qué sirve utilizar microformatos?

Pues para que cualquier proceso automático pueda indexar la información de una forma mucho más sencilla y precisa. Pensemos en una revisión de un producto, por ejemplo una película ¿puede saber un buscador o el navegador que estamos hablando de ella? A priori no es complicado, buscando el nombre de la misma en el título de la página web y su contenido ¿puede saber quién hizo la revisión, cuándo y que valoración tiene de la misma? Más complicado, las mejores tecnologías de búsqueda tienen muchos errores porque no hay nada en html que le de esta "semántica". Ahora bien, si como editores hubiésemos utilizado el microformato hReview, todo se habría conseguido de forma automática. Otro ejemplo sería el proyecto Live Clipboard paar el "copia y pega en la web" de Microsoft, que está bastante animosa apoyando los microformatos.

¿Cómo utilizarlos?

De nada servirían los microformatos si no se integran en los gestores de contenidos. No se trata, por supuesto, de andar editando el html y añadiendo estructuras complejas para "no geeks", se trata de que Wordpress y el resto de software para crear sitios tengan integrados los microformatos. Pensemos que todos los blogs de cine y los foros los utilizaran integrados en el formulario para escribir, sería posible armar un buscador capaz de saber la nota recibida por una película por la blogosfera y los foreros. Incluso un servicio que me permitiese escoger a mis críticos de cabecera y en función de lo que ellos hayan votado, me recomendase películas. Todo descentralizado, lo bueno de los microformatos es que dan el poder al editor sobre la organización de la información que publican. Eso sí, nada salva a este tipo de procesos de páginas artificiales que quisieran enviarles "spam".

Conclusión

Es complicado que veamos a corto plazo los ambiciosos planes de web semántica, con las ontologías y el RDF, pero sí creo que los microformatos van a ayudar a estructurar algo la información y a aportar semántica. Son una aproximación modesta comparado con lo que se quería conseguir, pero encaja en la web tal y como hoy la entendemos.

Los anuncios por parte de que Firefox 3.0 y Explorer 8 los soportarán son el espaldarazo final que se necesitaba, pero hay muchas otras iniciativas alrededor de ellos como es Pingerati, un buscador realizado por Technorati basado en microformatos. Tiene todo el sentido su apuesta: un buscador basado en microformatos necesita muchos menos recursos a la hora de analizar la información que aquél que bucea en información desestructurada.

Más información en:

Comentarios

Imagen de Fernando Blat

Technorati...

Muy acertada tu visión Antonio, como siempre. Estoy completamente de acuerdo que sin la integración en los gestores de contenido estamos perdidos, pero creo que sólo con eso no hay suficiente.

Y es que creo que hace falta que antes salga una killer-web-app que demuestre su utilidad: por ejemplo, que Google los empiece a tener en cuenta en sus búsquedas. Ahí será, creo yo, cuando la gente se conciencie de que son útiles. Si en ese momento que surge la necesidad de la gente, los CMSs ya están preparados, entonces voilá, quizá ya tengamos expansión del uso de microformatos.

¡Un saludo!

Imagen de Antonio Ortiz

Google...

u otra, hay tanta gente queriendo construir el "próximo Google" que al menos uno debería apostar por los microformatos. No veo a Technorati en condiciones de competir, pero a ver quien nos sorprende.

Imagen de Gonzalo

Abrir las puertas a nuevos microformatos

Coincido contigo.
Creo que los microformatos son muy útiles y están dando un impulso inesperado a la web semántica, hasta el punto de que el W3C está pretende integrar los microformatos en futuras versiones de XHTML, con RDFa.
No quito importancia a lo que está logrando technorati con sus vínculos relacionales, y creo que a los grandes motores de búsqueda no les costará trabajo, cuando realmente tengan intención, el usar los microformatos en beneficio de todos (más calidad de la información).
De todas formas, coincido en que es necesario que los gestores de contenido faciliten lo máximo posible la integración de los microformatos en páginas webs, sin necesidad de ser una persona con amplios conocimientos de HTML para ir editando el código, si es que se puede.
Por último, creo que debería haber más microformatos. Los que existen actualmente son tremendamente útiles, y tienen una gran difusión. Quizás tiene que llegar el momento en el que se descentralice el desarrollo de nuevos microformatos para avanzar con más rapidez y adaptarse a nuevas funcionalidades. Personalmente apuesto por los microformatos Dublin Core para fichas bibliográficas, tanto de libros como de artículos (aunque tienen la posibilidad de describir recursos, en general). ¿Pero porqué no un microformato para productos en venta? ¿U otro para billetes de avión? ¿hoteles? ¿vehículos?...
Creo que existen infinitas posibilidades, y su adopción puede tener beneficios inmediatos.
En cualquier caso, no olvidemos que los microformatos tienen menor "poder semántico", y no permite realizar relaciones complejas, como en RDF (consultar Etiquetas meta, ficheros RDF, microformatos: 3 sabores de la Web Semántica), pero si los microformatos se basasen en perfiles (profile) o esquemas (schema) formalmente definidos, y se pudiese indicar en la cabecera del documento que van a aparecer microformatos usando esquemas existentes... quizás se podría facilitar mucho su expansión.

Imagen de Anibal de la Torre

Pues tampoco lo veo

La verdad es que tampoco termino yo de ver lo de los microformatos. Desde mi punto de vista presentan el mismo problema que los metadatos: cuando se trata de concretar cuestiones semánticas, se requiere la intervención adicional de la persona que produce el contenido, y no veo yo al personal en muchísimos años por la labor de contribuir de manera estandarizada a la construcción de los contenidos en la Red.

Me da la impresión de que antes de eso, los buscadores dejarán de ser tan torpes ;-)

Imagen de Antonio Ortiz

A cambio de algo..

si algo hace un usuario es a cambio de algo. El microformato del tag de Technorati se usa porque permite al blog aparecer en las búsquedas de ese servicio, con los otros puede ocurrir algo similar: si hago una crítica de cine y quiero que mi valoración sea indexada correctamente, no tengo más que usar el formulario que mi CMS me facilita...

Imagen de Anibal de la Torre

Pero no todo el contenido

Desde esa perspectiva, probablemente se puedan idear muchos métodos eficientes, mediante los cuales los autores de contenidos se preocupen de promocionarlos. Incluso editores externos podrían encargarse de esa tarea sobre deterrminados contenidos relevantes.
Pero, para mí, lo verdaderamente interesante del futuro, que justifique el salto a la 3.0 sería que TODO en contenido de la Red esté "semánticamente indexado" (incluido imagen y video).

Imagen de Antonio Ortiz

¿Exceso de ambición?

Quizás haya sido el exceso de ambición lo que ha lastrado las iniciativas de la W3C. Sería genial ver como realidad lo que dices, pero creo que vamos a tener que conformarnos con una "web semántica de juguete" a corto plazo

Imagen de Aníbal de la Torre

Por supuesto

Completamente de acuerdo, cuando hablamos de futuro no concretamos su temporalización, estoy de acuerdo con que a corto plazo poco podemos esperar.

Es más, yo a veces pienso que cuando llegue la Web semántica "automático-efectiva", probablemente no sean necesarios muchísimos servicios de los que hoy se prestan en Internet. No sé, a lo mejor la Web 3.0 no es rentable económicamente por lo que no interesa su desarrollo.

Imagen de hCard

hCard

Yahoo ya está haciendo uso de los microformatos para formatear sus resultados. Pronto le seguirá Google y probablemente pronto se ponga de moda. Creo que cada ada vez está más claro que la web semántica es el futuro. Gracias a los microformatos se podrá reaprovechar la información existente para hacer cosas cada vez más grandes gracias a que las webs ofrecerán más datos sobre las características y la tipología de su información.

Opciones de visualización de comentarios

Seleccione la forma que prefiera para mostrar los comentarios y haga clic en «Guardar las opciones» para activar los cambios.

Enviar un comentario nuevo

El contenido de este campo se mantiene como privado y no se muestra públicamente.
If you have a Gravatar account, used to display your avatar.
  • Allowed HTML tags: <a> <em> <strong> <cite> <code> <ul> <ol> <li> <dl> <dt> <dd>
  • Saltos automáticos de líneas y de párrafos.

Más información sobre opciones de formato


Suscripción

Introduce tu dirección de correo:

Ofrecido por FeedBurner

Feed rss Lectores con feedburner

Créditos