Distribuir contenido powerset

Powerset para buscar... en Wikipedia

Picasso Powerset

Esta semana también ha sido la de la aparición de una primera versión de Powerset que permite hacer búsquedas en la Wikipedia y Freebase. Ciertamente es pronto para medir el verdadero potencial del proyecto: lo que ahora podemos disfrutar en su sitio oficial es una primera versión de la tecnología limitada a indexar un dominio concreto.

De entrada hay que apuntar Powerset está lejos de conseguir el que los usuarios puedan hacer búsquedas en lenguaje natural, pero sí que apuesta por una labor de "extraer el significado" de los contenidos que indexa, lo que a priori le permite responder a preguntas simples como las de la imagen y mejorar el resultado de las búsquedas al usar la semántica de los textos. Como afirman en SeL y Uberbin, Powerset se acerca más al concepto de "entender la web" que al de "procesar el lenguaje natural de las respuestas". Como extrae los hechos de un artículo en la wikipedia se puede observar con este ejemplo y la barra de la derecha.

Mi impresión es que Powerset es una apuesta interesante y a considerar como buscador para la empresa / organización, para contenidos verticales y el uso académico. De hecho creo que tiene más que ver con el protagonismo creciente de la Wikipedia en la web que con competir con Google como buscador (aunque quizás sí con Knol).

Powerset en el punto de mira de Microsoft

powerset¿Está Powerset en el punto de mira de Microsoft? Aunque de momento es sólo un rumor, me parece interesante comentarlo por como queda la situación tras la renuncia a comprar Yahoo. El escenario por el que podrían estar esperando una bajada en las acciones de Yahoo para retomar el intento de adquisición parece difuminarse y Microsoft se encuentra con un montón de dinero en el bolsillo que pensaba invertir y fallidas sus expectativas de crecer en los mercados de las búsquedas y la publicidad online.

Por otro lado tenemos Powerset, un buscador anunciado hace más de un año, con buena financiación y que se presentará - si algún día al fin lo hace - con el arma del procesamiento del lenguaje natural. De momento nada que se pueda ver en público, pero con una demo en su laboratorio privado a la que he podido echar un ojo. Quizás porque esté funcionando sólo en inglés y para un par de dominios - nada de indexar la web de verdad - pero no logro compartir las buenas críticas que está recibiendo Powerset. Es uno de esos dilemas, comprar antes es comprar barato pero asumes el riesgo de llevarte humo; para Powerset el dilema es de otra índole, si Microsoft piensa que vale 100 millones de dólares, ¿no merece la pena probar en el mercado?

El rumor, en News.com.

Powerset, Mahalo y Hakia frente a Google

mahaloArtículo en el NYT sobre nuevos proyectos de buscadores que quieren hincar el diente al mercado dominado por Google y en el que el 1% (según cuentas de Don Dodge) supondrían ingresos de 1.000 millones de dólares.

De las distintas aproximaciones, destacan la de las "búsquedas sociales", hablando sobre todo de Mahalo y su sistema de editores humanos para los primeros resultados de la "larga cola". En este campo, quizás habría que incluir los esfuerzos de la propia Google con Co-op y el potencial de Yahoo con del.icio.us para utilizar los favoritos almacenados por los usuarios en su algoritmo de ordenación de resultados.

El otro flanco que se la abre a Google es el de las propuestas que admiten consultas en lenguaje natural. Ahí es donde apuntan Powerset y Hakia, que quieren pasar de una lectura de la web basada en "Keywords" a motores que "entiendan" lo que las páginas dicen y lo que los usuarios preguntan.

En ambos casos, conviene un escepticismo importante antes de proclamar un candidato oficial al trono. Powerset puede mejorar la forma que tenemos de preguntar a un buscador, pero todavía no ha enseñado nada, por lo que es muy pronto para bautizarlo como aspirante. Hakia sí que se puede probar y la verdad es que no he observado grandes mejoras respecto a Google. En cuanto a las búsquedas sociales, Mahalo tiene su interés, aunque sigo pensando que la calidad de los resultados de un buscador se mide en la adecuación a lo que esperaba el usuario, y esto lo puede dar un algoritmo, un editor humano... o ninguno de los dos. Personalización (con los problemas de privacidad asociados), precisamente a lo que apunta Google y que obvian estos proyectos.

Powerset y el procesamiento del lenguaje natural

powersetDesde Powerset siguen demandando atención respecto a su apuesta por las búsquedas empleando lenguaje natural. Esta vez es Venture Beat quien se hace eco de la adquisición por parte de Powerset de una tecnología desarrollada en el Palo Alto Research Center de procesamiento del lenguaje natural. Además los redactores dicen estar "impresionados" con los resultados que da Powerset a algunas de sus preguntas.

Hay dos problemas que deberá afrontar Powerset. Uno es llegar a funcionar, lo que no es nada trivial como demuestra el montón de proyectos del mismo estilo que se quedaron en "vaporware". El segundo se refiere a conseguir que los usuarios cambien su forma de utilizar un buscador, pasando de utilizar frases en lugar de palabras clave. Vamos, que se pasaría de poner "Los Planetas último disco" a "¿Cuál es el último disco de los Planetas?". Nótese que el segundo método requiere más esfuerzo del usuario y que para un buen montón de búsquedas ("fotos de elsa pataki") el procesamiento del lenguaje natural aporta bastante poco (por no decir nada).

Y aunque Powerset parece que lo que quiere es salir en los medios ¿necesidad de más financiación?, aún cuando no tenga nada potable que enseñar todavía, mantengo lo que comentamos cuando fue presentado: No sé si en Powerset estarán los que puedan destronar a (o a ser comprados por) Google, pero sí que la compañía del famoso buscador parece muy empeñada en entrar en muchos mercados (vídeos, pagos, correo...) y no se le muy capaz de mejorar la tecnología de su sistema de búsquedas que al fin y al cabo es la que le permite conseguir ingresos. Y cambiar de buscador es tan fácil como teclear una nueva URL en el navegador.

Dinero para Powerset

powersetMe resultó muy interesante el planteamiento de Powerset de búsquedas en lenguaje natural. La noticia es que han recibido 12,5 millones de dólares de financiación de capital riesgo, lo que - espero - le sirva para ponerse en marcha y poder presentar su alternativa en productivo (vía Gurusblog).

No sé si Powerset va a conseguir lo que se propone (competir con Google ofreciendo consultas en lenguaje natural, es decir, no con listas de términos - las "keywords" - sino con frases con sentido), pero sí que en los últimos años los buscadores han avanzado realmente poco. Lo más interesante ha sido la aparición de del paradigma de las búsquedas sociales, pero -con Google a la cabeza- las compañías del negocio de la búsqueda han estado más interesadas en diversificar que en innovar.

Sitio oficial: Powerset.

Powerset y la búsqueda en lenguaje natural

powersetAdmitir consultas en lenguaje natural es una de las metas varias veces anunciadas y nunca alcanzada con resultados satisfactorios por ninguno de los buscadores comerciales conocidos hasta la fecha. Ask es probablemente quien más se ha esforzado por traer al mercado las búsquedas con lenguaje natural tras la compra de Teoma, pero tampoco ha conseguido ofrecer resultados interesantes.

Ahora es Powerset, una nueva compañía, quien se postula para competir con Google ofreciendo consultas en lenguaje natural, es decir, no con listas de términos (las "keywords") sino con frases con sentido. Hay quien afirma que "esta vez sí" (Venture Beat), pero puede que también sea el enésimo "hype" que nos venda humo. Powerset está cerrado y no se puede probar de momento.

La tecnología de buscadores que tenemos hoy en día es apenas el embrión de lo que nos cabe esperar en el futuro. Los buscadores son fáciles de engañar (hasta cierto punto) por los webmasters para influir en su ordenación, no ofrecen apenas posibilidades de personalización y hay que dirigirse a ellos como los indios de las películas.

Aunque no lo es todo, el poder dirigirse al buscador en lenguaje natural y que este logre recuperar la semántica de la consulta sería un salto cualitativo respecto a lo que impera hoy día (Google). Que uno escriba "películas rodadas en granada" y que el buscador entienda que Granada es una referencia geográfica (gracias al "en") y no sólo un término a buscar en el contenido de la página elevaría exponencialmente la posibilidad de encontrar resultados de calidad. La clave está en esas preposiciones que Google desprecia "en, de, por...".

No sé si en Powerset estarán los que puedan destronar a (o a ser comprados por) Google, pero sí que la compañía del famoso buscador parece muy empeñada en entrar en muchos mercados (vídeos, pagos, correo...) y no se le muy capaz de mejorar la tecnología de su sistema de búsquedas que al fin y al cabo es la que le permite conseguir ingresos. Y cambiar de buscador es tan fácil como teclear una nueva URL en el navegador.

sitio oficial: Powerset.


Suscripción

Introduce tu dirección de correo:

Ofrecido por FeedBurner

Feed rss Lectores con feedburner

Créditos