ReCaptcha y su crowdsourcing, a manos de Google

reCaptcha pasa a manos de Google, que anuncia su compra sin que haya trascendido el precio. ¿Por qué comprar cuando podrían haber hecho un sistema similar sin demasiada dificultad? Probablemente porque reCaptcha es bastante bueno y porque ha conseguido una gran base de clientes a base de ofrecer una integración muy sencilla con su API.

Para entender realmente el valor de reCaptcha hay que comprender exactamente cómo funciona: ofrece esos formularios en los que las palabras aparecen «borrosas», de manera que los sistemas OCR no puedan descifrarlas y sólo sean capaces de hacerlo seres humanos, evitando que los bots de spam puedan sobrepasarlos. ¿Dónde esta su peculiaridad? Pues en que reCaptcha siempre ofrece dos palabras, en una ha realizado la tarea de modificar una palabra para que aparezca más difícil de acertar, pero de la otra en cambio no conoce cuál es su significado. Cuando muchos usuarios le dan a esta última el mismo significado, entonces reCaptcha se lo asigna en su sistema. De esta forma articula un sistema de crowdsourcing para traducir capturas en palabras, algo que puede ser particularmente útil para verificar el reconocimiento de caracteres cuando se pasan libros a formato digital… asunto en el que anda muy interesado Google.