Kit Wai Chan - Fotolia

Gestionar Aprenda a aplicar las mejores prácticas y optimizar sus operaciones.

Conjuntos de datos diversificados para analítica entregan resultados de primera

Los equipos de análisis deben enfocarse en la diversidad de datos para garantizar que sus proyectos brinden las ideas más significativas, pero deben desconfiar de algunos obstáculos.

Después de que Toyota lanzó su Prius V en noviembre de 2011, los conductores pronto notaron un sonido extraño al frenar. Los propietarios de Prius comenzaron a llamar a los centros de atención al cliente en abril de 2012, y posteriormente la compañía resolvió un problema de frenos basándose en sus comentarios.

Pero la solución podría haber llegado antes. Una revisión de las publicaciones en las redes sociales mostró que los conductores comenzaron a publicar videos para documentar los sonidos que producían sus automóviles en enero de 2012, tres meses antes de que el problema se hiciera evidente a través de las llamadas de servicio al cliente.

Jayadev Gopinath, quien encabeza las operaciones de análisis y administración de datos en Toyota Motor North America Inc., dijo que esta historia muestra el poder de los conjuntos de datos diversificados para la analítica. El equipo de ingeniería de Toyota le dijo que podría haber solucionado el problema antes si hubiera tenido acceso a la información sobre las publicaciones en las redes sociales. Pero, en ese momento, la compañía no estaba analizando sistemáticamente los datos de las redes sociales.

Encontrar valor en múltiples conjuntos de datos

Lección aprendida, según Gopinath. "Hay datos en todas partes", dijo en una presentación en Gartner Data & Analytics Summit 2018 en Grapevine, Texas. "No es que no tengamos datos, pero normalmente están organizados en silos. El valor real es si puede vincularlos".

Hoy, Toyota está analizando una gama de fuentes de datos de una manera más sistemática. La compañía usa Power BI y Tableau para acceder a un lago de datos que ingiere datos desde una gama de fuentes tradicionales, que incluyen datos de clientes, datos de vehículos y datos de fabricación. El lago de datos también tiene datos de fuentes externas, incluidos JD Power, Experian y sitios de redes sociales.

Los asistentes exploran la sala de exposiciones en la Cumbre de datos y análisis de Gartner.

Esto le ha permitido a Toyota hacer campañas de marketing más a medida y monitorear las condiciones de operación en sus plantas de fabricación; en el futuro, también planea monitorear la salud del vehículo de forma remota a través de dispositivos de automóviles conectados. "La clave de todo esto son los datos", dijo Gopinath, cuyo título completo es gerente general de tecnología avanzada, plataformas, innovación, datos y análisis.

Un conjunto de datos diversificado puede mejorar un proyecto de analítica, pero reunir varias fuentes no está exento de riesgos. Hay algunas consideraciones a tener en cuenta al tratar de crear el conjunto de datos más amplio posible.

Establecer confianza en los datos a través de la gobernanza

El mayor problema al diversificar los conjuntos de datos para la analítica es garantizar la confianza en esos datos, dijo el analista de Gartner, Kurt Schlegel. Él dijo que hoy en día la gente tiene una tendencia a actuar como lo hicieron en una era anterior de inteligencia de negocios, durante la cual los analistas extraían datos de un sistema de registro (generalmente, el almacén de datos) que contenía datos verificados.

Pero ese nunca puede ser el caso cuando los usuarios de la línea de negocio reciben herramientas de exploración y preparación de datos de autoservicio que les permiten combinar y analizar datos de prácticamente cualquier fuente, incluidos los lagos de datos que agregan datos de fuentes dispares.

Para resolver este problema, Schlegel dijo que las políticas de gobernanza de datos deberían funcionar como Wikipedia: Permitir a los usuarios construir sus propios conjuntos de datos y hacer sus propios análisis, pero también usar metadatos para etiquetar de dónde provienen los datos individuales o dónde un resultado analítico podría ser débil.

"El lago de datos no reemplaza el almacén de datos", dijo Schlegel. "Pero podemos hacer posible establecer la confianza".

Eduque a los usuarios en un mundo diversificado de datos

Otra forma de abordar la complejidad que conlleva un entorno de conjuntos de datos diversificados para analítica es educar a los usuarios sobre cómo aprovecharlos. La analista de Gartner, Rita Sallam, dijo que la alfabetización de datos es un componente clave de un entorno de autoservicio en el que los usuarios tienen acceso a una variedad de fuentes de datos.

Sallam, quien también habló en la conferencia de Gartner, reconoció que las empresas tienen mucho que ganar al poner los datos en manos de los trabajadores de primera línea que pueden poner en práctica más directamente los conocimientos basados en datos. Pero simplemente darles datos y herramientas de BI a esos usuarios no es suficiente, dijo. Para hacer que el autoservicio de BI tenga el mayor impacto, las capacidades de análisis deben combinarse con sólidos programas de capacitación que instruyan a los usuarios sobre las mejores prácticas de calidad de datos, según Sallam.

"El mantra del autoservicio, aunque es necesario, está comenzando a mostrar sus limitaciones, particularmente a medida que aumenta la complejidad", dijo. "Desarrollar la alfabetización en programas de datos y análisis es un desafío clave".

Este artículo se actualizó por última vez en marzo 2018

Profundice más

Inicie la conversación

Envíenme notificaciones cuando otros miembros comenten sobre este artículo.

Por favor cree un Nombre de usuario para poder comentar.

- ANUNCIOS POR GOOGLE

Close