Podzinger en castellano

podzinger

Uno de los buscadores más interesantes aparecidos en los últimos meses, Podzinger, tiene ya versión en castellano. Hemos hablado varias veces por aquí de este buscador de podcasts, cuya tecnología indexa el contenido hablado y es en éste en el que busca Podzinger los términos que le indiquemos.

Las primeras pruebas que he hecho con Podzinger en castellano no dan unos resultados espectaculares precisamente (ejemplo buscando betis o Saramago), tiene un porcentaje aproximado del 80% de "falsos positivos", que es el peor error que puede dar un buscador. Se trata de podcast que Podzinger entiende que contiene los términos que le hemos indicado, pero que en realidad su aparición es debida a la imprecisión de la tecnología empleada para el reconocimiento automático del lenguaje.

Es de esperar que mejoren (el reconocimiento del habla no es un problema en absoluto trivial) y a buen seguro que lo harán. El futuro de los buscadores multimedia está en este tipo de tecnologías capaces de escrutar el contenido y no solo la metainformación suministrada con el mismo.

Sitio oficial: Podzinger.

Entradas relacionadas: Podzinger para buscar en los videocast, Podzinger o Podscope para buscar en el contenido de los podcast.

Comentarios

Imagen de Julio Vaca, Sr. Product Manager

PodZinger en Espanol

Me da un placer que consideres a PodZinger como uno de los buscadores más interesantes en los últimos meses. También me gustaría comentar un poco sobre el servicio, y explicar a tus leyentes algunas de las razones del porque tuviste un porcentaje de error tan alto en tus búsquedas.

Cuando decidimos lanzar PodZinger en Español, nos enfocamos principalmente en el mercado norte americano de habla hispana. Esto significa que cuando empezamos a entrenar nuestro reconocedor de palabras, nos enfocamos en Podcasts hechos en México, Colombia y Venezuela. Excluimos Podcasts de España y Argentina por que durante pruebas, el porcentaje de falsos positivos era de aproximadamente 65%. Una vez excluimos podcasts de estos países, el porcentaje bajo a un nivel 40%. Aprendimos que mezclando el castellano de España y Argentina, con el castellano de Norte América, confundía mucho al reconocedor de palabras. Lo interesante es que el Ingles presenta el mismo problema. Si mezclamos el Ingles Britanico, Norte Americano, Australiano y de Nueva Zelanda para entrenar el reconocedor, pues ya te has de imaginar el problema que se nos presenta por la fuerte distinción de acentos entre estos.

Conforme seguimos avanzando con el desarrollo de PodZinger, nos estaremos enfocando en mejorar nuestro reconocedor de palabras usando modelos específicos para los diferentes mercados de habla hispana que tenemos planeado apoyar. Obviamente, todo dependerá del tamaño del mercado y oportunidad que se presente.

Espero que sigas usando PodZinger, y mandes tus comentarios de cómo seguir mejorando el servicio.

Gracias

Julio E. Vaca
Sr. Product Manager
PodZinger.com

Imagen de Antonio Ortiz

Gracias Julio por tus

Gracias Julio por tus aclaraciones. El tema es que al indexar también contenidos de podcasts españoles, la experiencia final del usuario no es muy buena ¿cómo detectáis que un podcast es de estados unidos? teniendo en cuenta que muchos españoles optan por servidores de ese país creo que va a ser difícil de distinguir...

Opciones de visualización de comentarios

Seleccione la forma que prefiera para mostrar los comentarios y haga clic en «Guardar las opciones» para activar los cambios.

Enviar un comentario nuevo

El contenido de este campo se mantiene como privado y no se muestra públicamente.
If you have a Gravatar account, used to display your avatar.
  • Allowed HTML tags: <a> <em> <strong> <cite> <code> <ul> <ol> <li> <dl> <dt> <dd>
  • Saltos automáticos de líneas y de párrafos.

Más información sobre opciones de formato

Productos destacados

Suscripción

Introduce tu dirección de correo:

Ofrecido por FeedBurner

Feed rss Lectores con feedburner

Créditos