¿Es posible hoy crear otro Google?

GoogleLeyendo las críticas a Cuil y recordando las que hicimos también a Wikia Search, lo limitado que resultó ser Powerset, el escaso crecimiento de Hakia o la reorientación cada vez más evidente hacia los contenidos de Mahalo, creo que es oportuno preguntarse ¿Es posible que alguien cree otro Google hoy en día?.

Claro que propuestas estamos viendo muchas, alimentadas por un deseo de tener alternativas reales como indica Enrique. Hasta ahora todos los candidatos a «Google Killer» han resultado bastante pobres comparados con el líder. Y es que la historia del destronamiento de Altavista hoy por hoy parece difícil de repetirse. Por supuesto que estoy convencido de que Google no ha llegado a la cima de lo que pueden y deben ofrecer los buscadores, pero al contrario que Altavista, Google ha construido todo un ecosistema alrededor del buscador: tanto en lo económico (AdWords, AdSense) como en servicios y plataformas (Apps, GMail, buscador integrable en webs). Su marca es mucho más fuerte y sus procesos de innovación mucho más productivos.

powersetSe suele citar a menudo el hecho de que cambiar de buscador es tan fácil como escribir otra dirección en la barra del navegador como defensa del «no monopolio de Google». Parte de razón tienen, gran parte de la culpa de la situación la tienen los rivales de Google que, sencillamente, no están a su altura. Pero la compañía de Brin y Page cada vez quiere que los usuarios pasen más tiempo con ellos, leyendo el correo, consumiendo contenidos o usando sus aplicaciones, lo que no deja de ser una defensa ante la promiscuidad que permite la web. Es más, las herramientas para webmasters son cada vez más numerosas, desde Analitycs a Ad Manager. Todo ello redunda en abrir nuevas vías de negocio, reforzar las existentes y, sobre todo, creación de un ecosistema que refuerza el negocio principal, el buscador y la publicidad en la web.

Pongámonos en la piel de aquellos que, a pesar de todo, se encuentran en un garaje pensando en como enfrentarse al gran rey de la web, las opciones a día de hoy parecen pasar por:

  • Una aproximación similar al fenómeno de las búsquedas, con otro tipo de algoritmos. Es la apuesta de Cuil, que de momento naufraga en el intento. En esta sección deberíamos incluir a Yahoo y Windows Live, que cada día parecen perder terreno. A priori parece la peor estrategia, ni quienes tienen los recursos necesarios para hacerlo bien son capaces de conseguirlo.
  • Competir desde el paradigma de la web semántica. En esta liga juegan proyectos como Hakia o Powerset, que se enfrentan a la dificultad de que los contenidos en la web no están estructurados ni vienen acompañados de metainformación que les ayude. Aún así, en pequeñas parcelas de la web han mostrado algunos resultados interesantes. No parece que ninguno vaya a conseguir un buscador de propósito general a corto plazo capaz de competir con Google.
  • Los buscadores con «edición humana o componente social«. Ahí habría que incluir a Mahalo (que finalmente evoluciona hacia una página de contenidos) y también a Wikia Search. Se enfrentan a tres problemas: uno es que tienen difícil escalar (Mahalo), otro es que piden «trabajar al usuario» y eso es difícil que lo consigan si en Google tienen algo mejor sin esfuerzo (Wikia Search) y tres, Google puede comenzar a integrar sus conceptos de una manera no demasiado compleja en apariencia.
  • Nos queda quienes están apostando por otros nichos del sector de las búsquedas, como son los verticales y los buscadores en clasificados. Parece un terreno más complicado para Google, que se resiste a «complicar» su interfaz, algo necesario cuando acotamos la temática (si busco un vuelo, lo ideal es indicar fechas, destinos, etc….). Hay un montón de ejemplos en castellano e inglés. Menos riesgo de competencia desde Google, pero desde luego, menos negocio.
  • Hay quienes quieren competir en interfaz, explorando sistemas más visuales e incluso tridimensionales de representar la información. Google ha explotado como nadie la sencillez como arma para la efectividad y la productividad, de momento no parece que en este punto tengan un flanco débil.
  • Finalmente, hay quien estará pensando en un nuevo paradigma, una nueva aproximación. ¿Quizás en el lifesrteaming haya valor para usarlo en las búsquedas más allá de «buscar en mi universo personal»? ¿Es posible que los del.icio.us o bloglines de un usuario sean la base de sus resultados personalizados, como usar esa información para que sea útil al resto del 99% de los usuarios de la web?. En todo caso, debe ser algo que supere la concepción de valorar una web por los enlaces entrantes (matizada por los cientos de aspectos que a día de hoy Google tiene en cuenta).
  • Por su parte, parece que Google se mueve cada vez más – con buen sentido – hacia resultados personalizados, al final se trata de una respuesta a una necesidad de información realizada por un usuario determinado, cuya satisfacción es difícil que consiga con la misma respuesta que se da a alguien «de la otra punta del planeta».

Las posibilidades de futuros y presentes competidores parece que pasan por arriesgar con nuevos paradigmas, crear otro Google desde los mismos planteamientos se antoja francamente complicado y sólo alguien con los recursos de compañías como Yahoo pueden planteárselo. Vamos a seguir viendo intentos y ojalá que los resultados de Cuil y compañía no desanimen a quienes piensen emprender e innovar en el sector de las búsquedas; y esto no es ser «anti Google» (etiqueta que empieza a acompañarme últimamente), es simplemente que el monocultivo nunca ha sido bueno, ni lo era en el software de escritorio ni lo es en la web.

Powerset en Live Search

powersetConfirmación de un movimiento del que hemos hablado bastante por aquí: Microsoft compra Powerset y lo integrará en Live Search. De esta manera emprende un nuevo camino en su esfuerzo por crecer en el mercado de los buscadores tras el fracaso de la compra de Yahoo.

En Octubre de 2006 comenzamos a hablar de Powerset y su propuesta de ofrecer búsqueda en lenguaje natural, algo de lo que está muy lejos, tal como pudimos comprobar hace un par de meses. A día de hoy, Powerset ofrece algunas avances significativos, pero no en el procesamiento del lenguaje natural sino en la labor de «extraer el significado» de los contenidos que indexa. Por el momento apenas permite búsquedas en la Wikipedia, pero aporta varios elementos a observar.

El pacto parece interesante a priori para ambos. Microsoft compra «barato» (o al menos no tan caro como le resultaría una compañía establecida, se hablaba de 100 millones de dólares) y en un mercado en el que necesita imperiosamente crecer como es el de las búsquedas en internet. Para Powerset supone el disponer de recursos para extender su «buscador semántico».

Respecto a que cabe esperar, teóricamente Powerset ayudará a Live Search a diferenciarse. El servicio de Microsoft, en lo que a buscadores basados en keywords se refiere, siempre ha estado muy lejos de la calidad de Google. Toca probar una aproximación diferente, aunque para ello necesitarán extender Powerset al resto de la web… y no todo está tan bien organizado como la Wikipedia.

Más información: blog Live Search, blog de Powerset

Powerset, a punto de ser comprada por Microsoft

Picasso Powerset

Powerset y Microsoft habrían llegado a un acuerdo, por el que la primera pasaría a ser propiedad de Redmond por una cantidad algo superior a los 100 millones de dólares. El rumor – todavía no confirmado por ninguna de las partes – lo dan en Venture Beat y confirmaría el interés del que se viene hablando hace meses.

Por aquí hemos hablado mucho sobre Powerset, un buscador que se presenta como abanderado de una nueva genereción que apuesta por el procesamiento del lenguaje natural. La verdad es que la primera versión que permite buscar en Wkipedia tiene elementos interesantes, pero dista de ser algo impresionante.

Aunque está claro que Microsoft tiene que mover ficha en el mercado de las búsquedas tras el fiasco de la compra de Yahoo, el modelo de Powerset está lejos de ser más eficiente que el de los buscadores tradicionales. Tanto por la dificultad intrínseca de aplicar técnicas semánticas a una web que no tiene información estructurada (de ahí que hayan empezado por indexar sólo Wikipedia) como por el hecho de que aceptar realmente el lenguaje natural es muy complejo, amén de que probablemente no tan efectivo como buscar por keywords. En todo caso, Powerset es un proyecto muy interesante, más como complemento para ciertas búsquedas dentro de un buscador general que como producto independiente.

Powerset para buscar… en Wikipedia

Picasso Powerset

Esta semana también ha sido la de la aparición de una primera versión de Powerset que permite hacer búsquedas en la Wikipedia y Freebase. Ciertamente es pronto para medir el verdadero potencial del proyecto: lo que ahora podemos disfrutar en su sitio oficial es una primera versión de la tecnología limitada a indexar un dominio concreto.

De entrada hay que apuntar Powerset está lejos de conseguir el que los usuarios puedan hacer búsquedas en lenguaje natural, pero sí que apuesta por una labor de «extraer el significado» de los contenidos que indexa, lo que a priori le permite responder a preguntas simples como las de la imagen y mejorar el resultado de las búsquedas al usar la semántica de los textos. Como afirman en SeL y Uberbin, Powerset se acerca más al concepto de «entender la web» que al de «procesar el lenguaje natural de las respuestas». Como extrae los hechos de un artículo en la wikipedia se puede observar con este ejemplo y la barra de la derecha.

Mi impresión es que Powerset es una apuesta interesante y a considerar como buscador para la empresa / organización, para contenidos verticales y el uso académico. De hecho creo que tiene más que ver con el protagonismo creciente de la Wikipedia en la web que con competir con Google como buscador (aunque quizás sí con Knol).

Os dejo con un vídeo explicativo de Powerset:


Powerset Demo Video from officialpowerset on Vimeo.

Powerset en el punto de mira de Microsoft

powerset¿Está Powerset en el punto de mira de Microsoft? Aunque de momento es sólo un rumor, me parece interesante comentarlo por como queda la situación tras la renuncia a comprar Yahoo. El escenario por el que podrían estar esperando una bajada en las acciones de Yahoo para retomar el intento de adquisición parece difuminarse y Microsoft se encuentra con un montón de dinero en el bolsillo que pensaba invertir y fallidas sus expectativas de crecer en los mercados de las búsquedas y la publicidad online.

Por otro lado tenemos Powerset, un buscador anunciado hace más de un año, con buena financiación y que se presentará – si algún día al fin lo hace – con el arma del procesamiento del lenguaje natural. De momento nada que se pueda ver en público, pero con una demo en su laboratorio privado a la que he podido echar un ojo. Quizás porque esté funcionando sólo en inglés y para un par de dominios – nada de indexar la web de verdad – pero no logro compartir las buenas críticas que está recibiendo Powerset. Es uno de esos dilemas, comprar antes es comprar barato pero asumes el riesgo de llevarte humo; para Powerset el dilema es de otra índole, si Microsoft piensa que vale 100 millones de dólares, ¿no merece la pena probar en el mercado?

El rumor, en News.com.

Powerset, Mahalo y Hakia frente a Google

mahaloArtículo en el NYT sobre nuevos proyectos de buscadores que quieren hincar el diente al mercado dominado por Google y en el que el 1% (según cuentas de Don Dodge) supondrían ingresos de 1.000 millones de dólares.

De las distintas aproximaciones, destacan la de las «búsquedas sociales», hablando sobre todo de Mahalo y su sistema de editores humanos para los primeros resultados de la «larga cola». En este campo, quizás habría que incluir los esfuerzos de la propia Google con Co-op y el potencial de Yahoo con del.icio.us para utilizar los favoritos almacenados por los usuarios en su algoritmo de ordenación de resultados.

El otro flanco que se la abre a Google es el de las propuestas que admiten consultas en lenguaje natural. Ahí es donde apuntan Powerset y Hakia, que quieren pasar de una lectura de la web basada en «Keywords» a motores que «entiendan» lo que las páginas dicen y lo que los usuarios preguntan.

En ambos casos, conviene un escepticismo importante antes de proclamar un candidato oficial al trono. Powerset puede mejorar la forma que tenemos de preguntar a un buscador, pero todavía no ha enseñado nada, por lo que es muy pronto para bautizarlo como aspirante. Hakia sí que se puede probar y la verdad es que no he observado grandes mejoras respecto a Google. En cuanto a las búsquedas sociales, Mahalo tiene su interés, aunque sigo pensando que la calidad de los resultados de un buscador se mide en la adecuación a lo que esperaba el usuario, y esto lo puede dar un algoritmo, un editor humano… o ninguno de los dos. Personalización (con los problemas de privacidad asociados), precisamente a lo que apunta Google y que obvian estos proyectos.

Powerset y el procesamiento del lenguaje natural

powersetDesde Powerset siguen demandando atención respecto a su apuesta por las búsquedas empleando lenguaje natural. Esta vez es Venture Beat quien se hace eco de la adquisición por parte de Powerset de una tecnología desarrollada en el Palo Alto Research Center de procesamiento del lenguaje natural. Además los redactores dicen estar «impresionados» con los resultados que da Powerset a algunas de sus preguntas.

Hay dos problemas que deberá afrontar Powerset. Uno es llegar a funcionar, lo que no es nada trivial como demuestra el montón de proyectos del mismo estilo que se quedaron en «vaporware». El segundo se refiere a conseguir que los usuarios cambien su forma de utilizar un buscador, pasando de utilizar frases en lugar de palabras clave. Vamos, que se pasaría de poner «Los Planetas último disco» a «¿Cuál es el último disco de los Planetas?». Nótese que el segundo método requiere más esfuerzo del usuario y que para un buen montón de búsquedas («fotos de elsa pataki») el procesamiento del lenguaje natural aporta bastante poco (por no decir nada).

Y aunque Powerset parece que lo que quiere es salir en los medios ¿necesidad de más financiación?, aún cuando no tenga nada potable que enseñar todavía, mantengo lo que comentamos cuando fue presentado: No sé si en Powerset estarán los que puedan destronar a (o a ser comprados por) Google, pero sí que la compañía del famoso buscador parece muy empeñada en entrar en muchos mercados (vídeos, pagos, correo…) y no se le muy capaz de mejorar la tecnología de su sistema de búsquedas que al fin y al cabo es la que le permite conseguir ingresos. Y cambiar de buscador es tan fácil como teclear una nueva URL en el navegador.

Dinero para Powerset

powersetMe resultó muy interesante el planteamiento de Powerset de búsquedas en lenguaje natural. La noticia es que han recibido 12,5 millones de dólares de financiación de capital riesgo, lo que – espero – le sirva para ponerse en marcha y poder presentar su alternativa en productivo (vía Gurusblog).

No sé si Powerset va a conseguir lo que se propone (competir con Google ofreciendo consultas en lenguaje natural, es decir, no con listas de términos – las «keywords» – sino con frases con sentido), pero sí que en los últimos años los buscadores han avanzado realmente poco. Lo más interesante ha sido la aparición de del paradigma de las búsquedas sociales, pero -con Google a la cabeza- las compañías del negocio de la búsqueda han estado más interesadas en diversificar que en innovar.

Sitio oficial: Powerset.

Powerset y la búsqueda en lenguaje natural

powersetAdmitir consultas en lenguaje natural es una de las metas varias veces anunciadas y nunca alcanzada con resultados satisfactorios por ninguno de los buscadores comerciales conocidos hasta la fecha. Ask es probablemente quien más se ha esforzado por traer al mercado las búsquedas con lenguaje natural tras la compra de Teoma, pero tampoco ha conseguido ofrecer resultados interesantes.

Ahora es Powerset, una nueva compañía, quien se postula para competir con Google ofreciendo consultas en lenguaje natural, es decir, no con listas de términos (las «keywords») sino con frases con sentido. Hay quien afirma que «esta vez sí» (Venture Beat), pero puede que también sea el enésimo «hype» que nos venda humo. Powerset está cerrado y no se puede probar de momento.

La tecnología de buscadores que tenemos hoy en día es apenas el embrión de lo que nos cabe esperar en el futuro. Los buscadores son fáciles de engañar (hasta cierto punto) por los webmasters para influir en su ordenación, no ofrecen apenas posibilidades de personalización y hay que dirigirse a ellos como los indios de las películas.

Aunque no lo es todo, el poder dirigirse al buscador en lenguaje natural y que este logre recuperar la semántica de la consulta sería un salto cualitativo respecto a lo que impera hoy día (Google). Que uno escriba «películas rodadas en granada» y que el buscador entienda que Granada es una referencia geográfica (gracias al «en») y no sólo un término a buscar en el contenido de la página elevaría exponencialmente la posibilidad de encontrar resultados de calidad. La clave está en esas preposiciones que Google desprecia «en, de, por…».

No sé si en Powerset estarán los que puedan destronar a (o a ser comprados por) Google, pero sí que la compañía del famoso buscador parece muy empeñada en entrar en muchos mercados (vídeos, pagos, correo…) y no se le muy capaz de mejorar la tecnología de su sistema de búsquedas que al fin y al cabo es la que le permite conseguir ingresos. Y cambiar de buscador es tan fácil como teclear una nueva URL en el navegador.

sitio oficial: Powerset.

Actualización: