Para entender los trending topics Twitter utiliza… humanos

Imperdible el post en el blog de ingeniería de Twitter sobre como está montado el sistema para detectar e intentar entender el significado de las búsquedas masivas que se producen en el servicio.

Además de un sistema que detecta la frecuencia de búsquedas y encuentra las que se hacen populares, Twitter utiliza Mechanical Turk de Amazon para que humanos le ayuden a detectar el significado, la categoría a la que se refieren y de ahí puedan inferir cuál es la publicidad apropiada para la búsqueda.

Frente al sistema completamente automatizado de Google, la exigencia de entender en tiempo real de a qué se refiere una búsqueda popular o un trending topic y lo intrincado de las expresiones (hashtags, juegos de palabras, polisemia) hace que Twitter apueste por preguntar a personas y no a ningún sistema de procesamiento del lenguaje natural de tantos que pululan por ahí.

3 comentarios en “Para entender los trending topics Twitter utiliza… humanos

    1. El procesamiento de lenguaje natural es un campo muy complejo de la inteligencia artificial. No es que las cosas sean mediocres, es que no se puede pedir que se hagan por arte de magia: tiempo, investigación y desarrollo.

      1. Yo no estoy diciendo que los investigadores sean unos cutres, sino que el estado del arte actual es mediocre comparado con aproximaciones diferentes. Por ejemplo, un traductor estadístico (como Google Translate) funciona mejor que un traductor que intente separar las palabras en lemas y «procesar su significado» más allá de la simple concurrencia estadística.

Los comentarios están cerrados.