Maksim Kabakou - Fotolia

Noticias Manténgase informado sobre las más recientes actualizaciones de productos y noticias de tecnología empresarial.

Cómo Pandora construyó un mejor motor de recomendaciones

Descubra cómo Pandora desarrolló una aplicación de AI para construir un mejor motor de recomendaciones, que combina novedad y comodidad.

Pandora se ha convertido rápidamente en uno de los servicios de streaming de música más populares construidos sobre una infraestructura de Java, Scala y Erlang. Presenta el concepto de estaciones de radio personalizadas, que permiten a los usuarios reproducir automáticamente géneros musicales. A medida que jugadores más grandes como Apple y Amazon entran en el campo, Pandora se dio cuenta de que necesitaba un motor de recomendaciones mejor para seguir construyendo su base de usuarios.

"La visión de Pandora es ser una fuente de música sin esfuerzo", dijo Oscar Celma, director de investigación de Pandora. Las estaciones son listas de reproducción generadas automáticamente con base en la retroalimentación de los usuarios. Celma dijo que el desafío está en equilibrar la nueva música con la música popular. Esta estrategia basada en la nube ha permitido a la compañía crecer a 78 millones de usuarios que escuchan un promedio de 24 horas al mes.

Esta estrategia segura basada en la nube se incorporó en la estación Pandora Thumbprint Radio, que proporciona una pista de sonido personalizada para cada usuario. Esta estación ha crecido rápidamente para convertirse en la estación más popular de Pandora, con 30 millones de oyentes activos, que representan el 3% de la escucha en general. La investigación de Pandora encontró el éxito mediante la experimentación con más de 70 algoritmos diferentes, y una estrategia de pruebas sofisticadas.

Desarmando el motor de recomendación

Pandora adopta un enfoque de varios niveles para evaluar y recomendar música. Un equipo de musicólogos anota canciones basadas en el género, el ritmo y la progresión. Estos datos se transforman en un vector para comparar la similitud de las canciones. Este enfoque ayuda a promover la presentación de música de cola larga de artistas desconocidos que podría ser una buena elección para un usuario en particular.

El servicio también aprovecha la retroalimentación de los usuarios. Ha reunido casi 75 mil millones de puntos de retroalimentación sobre lo que les gusta a los usuarios. Los algoritmos de recomendación de Pandora también hacen un filtrado personalizado basado en la elección del usuario sobre música, las estaciones que escuchan y su geografía.

El recomendador utiliza unos 70 algoritmos diferentes: 10 analizan contenido, 40 procesan inteligencia colectiva, y luego otros 30 hacen filtrado personalizado. Celma dijo: "Esto es un desafío desde el punto de vista de la ingeniería. Tenemos el objetivo de que, cuando se pulsa una canción, la recomendación para la siguiente canción se produzca en menos de 100 milisegundos. Es difícil hacer esto de una manera que escale por todos los usuarios".

Balancear lo nuevo con familiar

Uno de los mayores retos en la construcción de un motor de recomendación mejor para la música, los programas de televisión, los libros u otros productos se encuentra en el equilibrio de lo nuevo con lo familiar. El problema de personalización puede ser más difícil porque los estados de ánimo cambian. Es posible que a los usuarios no les gusten hoy las canciones que fueron sus favoritas el año pasado. A veces los usuarios solo quieren canciones familiares, mientras que en otros momentos pueden emocionarse más por las nuevas canciones.

El motor de recomendación necesita reproducir algunas canciones nuevas para descubrir lo que les gusta a los usuarios. Pero si a los usuarios les terminan no gustando demasiadas canciones, pueden ser reacios a volver al servicio. Una manera útil de pensar en el espacio es como los ejes XY separados de un gráfico XY para la novedad frente a la relevancia. Las canciones familiares son relevantes, pero tienen poca novedad. Celma comentó: "Idealmente, la exploración debería caer en lo que ellos piensan que es relevante, pero muy novedoso".

La mayoría de los otros agentes de recomendación de música comienzan con canciones populares, y luego poco a poco agregan más novedad a medida que aprenden sobre el usuario. Pandora ha estado empujando el borde para sugerir canciones más novedosas que a los usuarios les gustan más rápidamente. Sin embargo, Celma destacó que es importante crear confianza y añadir novedad lentamente para que los usuarios sigan regresando.

Un objetivo clave de la radio Thumbprint es crear una lista de reproducción que un usuario pueda hacer por sí mismo, sobre la base de sus interacciones anteriores con diferentes estaciones de Pandora. Pero esto ha planteado numerosas preguntas. ¿Con qué frecuencia debe cambiar de un género a otro? ¿Cómo equilibrar la familiaridad y el descubrimiento?

Un usuario típico puede suscribirse a 100 estaciones diferentes, pero solo escuchar activamente cuatro. Los algoritmos de Thumbprint solo incluyen datos de escucha cuando los usuarios han proporcionado retroalimentación sobre al menos cuatro canciones en una estación. También sopesan géneros basados ​​en la frecuencia con la que un usuario escucha una categoría particular de canciones.

Probando las preferencias del motor de recomendación

El método más rápido para identificar la calidad de un nuevo motor de recomendación es probarlo fuera de línea, basado en datos históricos del usuario. En este caso, el equipo analiza 11 meses de datos de usuario para generar una serie de recomendaciones. El nuevo recomendador se valida con base en la retroalimentación de un mes de las interacciones reales del usuario. De acuerdo con Celma: "Queríamos hacer algunas pruebas internas antes de lanzarlo al aire".

Un segundo nivel de pruebas se hace con un grupo pequeño de oyentes para ver cómo se mantiene en el mundo real. En este caso, el sistema puede probar un nuevo algoritmo en el recomendador con el 1% de los usuarios, y comparar los resultados con el recomendador existente. Pandora podría tener varios de estos diferentes experimentos en curso en un momento dado, y los resultados se analizan en un período de 6 a 9 meses. Este período de prueba más largo les da tiempo para obtener mejores datos sobre el uso y el número de gustos/disgustos registrados por los usuarios.

La mayoría de las métricas se basan en la cantidad de tiempo que los usuarios utilizan para escuchar música y el número de días diferentes en que regresan a la aplicación. No tienden a cambiar mucho día a día, ya que la diferencia significativa tiende a ser más lenta y pequeña. Un cambio típico entre dos implementaciones de un recomendador podría ser solo un 0.2% de aumento en el tiempo de escucha. En general, ellos han encontrado que los usuarios más comprometidos tienden a estar más abiertos a la novedad. Estos usuarios tienden a dar una mejor retroalimentación sobre su experiencia en general.

Puede ser difícil tratar de analizar demasiados datos sobre el número de veces que los usuarios reenvían, reproducen o gustan de las canciones. "Añadir más señales al análisis puede producir más datos, pero también hay más ruido", dijo Celma.

Próximos pasos

Quizás le interese también:

Modelado predictivo exitoso requiere conjuntos correctos de datos para analizar

La analítica avanzada cambiará como funcionan los negocios

Comparación de software BI de autoservicio: Tableau vs. Power BI, Qlik Sense

Profundice más

Inicie la conversación

Envíenme notificaciones cuando otros miembros comenten sobre este artículo.

Por favor cree un Nombre de usuario para poder comentar.

- ANUNCIOS POR GOOGLE

Close