BACKGROUND IMAGE: Petya Petrova - Fotolia

Evaluar Conozca los pros y contras de las tecnologías, productos y proyectos que está considerando.

Herramientas de análisis de datos para científicos de datos van más allá de la visualización de BI

Una nueva generación de herramientas de análisis de datos para científicos de datos pretende ofrecer mucho más que software de inteligencia de negocios, incluidos análisis predictivos y análisis exploratorios.

La mayoría de las grandes empresas confían en el software de inteligencia empresarial para visualizar datos y profundizar en métricas, como las tasas de conversión a lo largo del tiempo. Esas herramientas de inteligencia de negocios (BI) se diferencian de una nueva generación de herramientas de análisis de datos en un área crítica: fórmulas mágicas.

Mientras que las fórmulas mágicas parecen un diferenciador positivo para los usuarios de negocios que desean una herramienta de análisis fácil de usar, los científicos de datos se alejan de esos tipos de herramientas automatizadas de caja negra, porque las fórmulas automatizadas significan menos control, menos responsabilidad y menos flexibilidad. Los científicos de datos utilizan típicamente herramientas de BI junto con una mezcla de otras plataformas para cosas como análisis avanzado, exploración de datos, modelado de datos y edición de SQL.

Patrick Steigler, director de ciencia de datos en Flexport, una compañía de logística y cadena de suministro con sede en San Francisco, utiliza una herramienta de análisis de datos de Periscope Data porque combina una serie de funciones que de otro modo requerirían múltiples herramientas. Antes de Periscope, Steigler usaba una mezcla de aplicaciones locales; MySQL Workbench para consultas de bases de datos, modelado, diseño y visualización; y Oracle Migration Workbench para mover datos. También necesitaba una plataforma de informes y cuadros de mando. Todo ese movimiento entre herramientas significó más tiempo añadido a su flujo de trabajo.

"Requería un editor de SQL para escribir una consulta para conectar a la base de datos, y yo vería los datos. Ahora, tomen esa consulta, ejecútenla en R, ejecuten la gráfica de la distribución de los datos para ver si encuentran algún valor atípico. Eso llevaría cinco minutos", dijo. "Al usar Periscope, toma alrededor de 15 segundos, lo que no parece mucho, pero cuando haces esto todo el día, se acumula".

El ahorro de tiempo es uno de los principales puntos de venta que Harry Glaser, cofundador y CEO de Periscope Data, utiliza como argumento para implementar herramientas de análisis de datos.

"Todo el día de los analistas de datos se les va en ejecutar consulta tras consulta contra bases de datos", dijo. "Lleva mucho tiempo ejecutar las consultas SQL e interpretar el resultado, ponerlo en Excel, enviar el informe ... todo este flujo de trabajo lleva tiempo [que los científicos de datos] podrían dedicar a hacer un nuevo análisis".

BI vs. herramientas de análisis de datos

Todas las compañías tecnológicas intentan diferenciarse de alguna manera, ya sea para sobresalir del paquete o para evitar tener la apariencia de competir directamente con los líderes del mercado. El CEO de Periscope afirmó que el software de su compañía es realmente diferente de las herramientas de BI tradicionales en el sentido de que proporciona un acceso a datos más amplio específicamente para los equipos de ciencia de datos.

"Periscope no es una herramienta de BI, y la mayoría de nuestros clientes tienen herramientas de BI", dijo Glaser. "Las herramientas de BI como PowerBI se enfocan en el CMO [director de marketing], brindándoles paneles de control, y así es como el CMO ve las tasas de conversión, las métricas a lo largo del tiempo, día tras día, semana a semana.

"Pero, si quiero hacer un análisis de todos los barcos que salen de Oakland [Calif.] y hay una huelga en Shenzhen [China], necesito saber a dónde debemos encaminar los barcos y cuánta producción podríamos perder", dijo. "Pensamos en cómo podemos hacer la vida del analista de datos más fácil, en lugar de la CMO".

Específicamente, las herramientas de BI tradicionales se centran en las áreas de visualización y comunicación del ciclo de vida de los datos, mientras que una herramienta de análisis de datos cubre más del ciclo de vida de los datos, incluyendo la ingesta de datos, el almacenamiento y la gestión de datos; manipulación de datos; visualización de datos; y comunicación de datos. Dado que la mayoría de las herramientas de BI se centran solo en las últimas dos partes del ciclo de vida de los datos, los usuarios pueden necesitar otras herramientas, como los SQL Workbenches y los trabajos CRON para llenar el vacío, dijo Glaser.

Pero los principales proveedores de BI y visualización de datos como Tableau y Qlik dicen que sus productos también soportan este tipo de tareas. En particular, Tableau ha impulsado los últimos años para agregar un soporte de análisis más profundo a su software en un esfuerzo por romper con las limitaciones percibidas del BI tradicional. Sin embargo, la mayoría de los clientes de esas empresas utilizan el software para la elaboración de informes tradicionales.

Según Glaser, los usuarios de Periscope pueden realizar inmersiones profundas ad hoc y amplias exploraciones de datos al proporcionar a los analistas acceso a todos los niveles de datos. Las herramientas de análisis de datos también requieren habilidades que el usuario de negocios promedio no tiene; necesita saber SQL y, como se mencionó anteriormente, no hay fórmulas mágicas en las que confiar.

"Los analistas no quieren la automatización, porque si algo no está bien, el equipo de datos tiene la culpa", dijo Glaser. "Usted es quien hace las suposiciones cuando introduce los datos en Periscope".

La herramienta de Periscope, que se basa en la nube y se ejecuta en Amazon Redshift, se conecta directamente a todas las bases de datos de un usuario y le permite escribir SQL para ejecutar, guardar y compartir análisis sobre miles de millones de filas de datos en segundos, según la compañía. De acuerdo con Steigler de Flexport, una herramienta de análisis de datos que sirve como editor de SQL y una plataforma de visualización ofrece otros beneficios, como la confianza en los datos.

Periscope Data tiene una serie de compañías con nombres familiares en su lista de clientes, desde Adobe y el fabricante de guitarras Fender hasta la Cruz Roja, que según Glaser usa la herramienta de Periscope para el mapeo y análisis de socorro en casos de desastre.

De manera similar, Flexport utiliza la herramienta de Periscope en su negocio, que respalda el movimiento de carga a través de líneas internacionales, autoridades anteriores de importación y exportación, y autoridades de transporte terrestre y marítimo. La tecnología de Flexport garantiza que todas las partes involucradas con la carga se mantengan actualizadas en tiempo real.

Hoja de ruta de Periscope Data

Mientras que las herramientas de análisis de datos ofrecen más fidelidad que las herramientas de BI tradicionales, los usuarios desean aún más: las capacidades de exploración de datos, en particular.

Periscope sabe que hay más por hacer y planea agregar funciones a corto plazo. La compañía comenzó con el análisis basado en proyectos, pero muchas otras cosas que hacen los equipos de datos podrían agregarse al software de Periscope, incluida la exploración de datos, la organización de datos y la ingeniería de datos.

"Agregaremos esas y otras capacidades con el tiempo", dijo Glaser. "Estamos avanzando más allá de los productos de análisis de datos, incluidos el análisis predictivo, el análisis exploratorio y la colaboración entre equipos ... Agregar un análisis predictivo realmente bueno es un proyecto de seis a nueve meses".

Periscope lanzó recientemente la integración de Slack, y los usuarios pueden esperar más integraciones en los próximos dos o tres años, dijo.

El redactor senior de noticias Ed Burns contribuyó a este informe.

Este artículo se actualizó por última vez en diciembre 2018

Inicie la conversación

Envíenme notificaciones cuando otros miembros comenten sobre este artículo.

Por favor cree un Nombre de usuario para poder comentar.

- ANUNCIOS POR GOOGLE

Close