JohanSwanepoel - Fotolia

Evaluar Conozca los pros y contras de las tecnologías, productos y proyectos que está considerando.

Analítica de datos en la nube obtiene un perfil más alto en las empresas

Lenovo y Autodesk son dos organizaciones que están aumentando su uso de la nube para aplicaciones analíticas, buscando reducir costos, agregar flexibilidad y acelerar el procesamiento de datos.

A medida que Lenovo desarrolló su arquitectura de análisis interno durante los últimos cuatro años, el fabricante de PC aprovechó la nube de Amazon Web Services para aplicaciones básicas de almacenamiento de datos y de inteligencia de negocios. Sin embargo, para el análisis predictivo de nivel superior, mantuvo las cosas en las instalaciones… Hasta ahora.

En un esfuerzo por acelerar el análisis de marketing y los datos de clics de internet, Lenovo planea mover gran parte de su trabajo de analítica avanzada también a la nube. La estrategia expandida de análisis de datos en la nube agregará capacidades de procesamiento en tiempo real que no son compatibles con el clúster Hadoop local de la empresa, diseñado para gestionar trabajos por lotes para la ingestión y el análisis de datos.

El objetivo final es permitir una publicidad en línea y marketing por correo electrónico más orientados, que mejoren tanto la experiencia del cliente como los resultados de Lenovo, dijo Marc Gallman, su gerente senior de big data. Gallman, que trabaja en la oficina central de Lenovo en Morrisville, Carolina del Norte, dirige un equipo analítico que también es responsable de desplegar y administrar la arquitectura de big data de la compañía.

Puede tardar hasta cinco horas obtener registros del flujo de clics y otros datos relevantes en el cluster local para su análisis, dijo Gallman. Esta cantidad de latencia dificulta la eficacia de la publicidad de seguimiento de Lenovo dirigida a posibles compradores que han visitado su sitio web.

Demasiada información publicitaria

"Los clientes están viendo más anuncios de lo necesario", dijo Gallman, señalando que los costos de publicidad de la empresa son más altos de lo que deberían ser como resultado. Además, Lenovo corre el riesgo de irritar a la gente golpeándolos con varios anuncios en línea, incluyendo aquellos que podrían no ser relevantes para ellos.

Marc Gallman

A través del enfoque basado en la nube, Gallman espera reducir la latencia de procesamiento a una hora o menos para que las decisiones de sí o no sobre la colocación de anuncios se puedan hacer sobre una base mucho más oportuna, y con mayor precisión.

El impulso de análisis de datos en la nube aumentará el uso de Lenovo de la plataforma de Amazon Web Services (AWS), que ha involucrado principalmente el almacén de datos Amazon Redshift y el servicio Amazon Simple Storage Service (S3) hasta este momento. Gallman dijo que su equipo ha estado viendo varias opciones de tecnología AWS en la planificación de la expansión de la nube, incluyendo el servicio de consulta Amazon Athena, el motor de analítica Amazon Machine Learning y la plataforma de big data de Amazon Elastic MapReduce construida alrededor de Hadoop y tecnologías relacionadas.

La arquitectura de analítica de Lenovo, denominada LUCI Sky (sigla para Lenovo Unified Customer Intelligence), fue diseñada como una nube híbrida y un entorno local en 2013. Sin embargo, la necesidad del negocio de un análisis de datos más rápido ofrece una mayor oportunidad de aprovechar la nube para la analítica, dijo Gallman, señalando una combinación de beneficios esperados de costos, flexibilidad y fiabilidad.

"Puedes levantar un cluster pequeño y persistente, y hacer que sea dinámico a medida que aumenta la carga de trabajo", explicó.

Gallman también dijo que es más fácil incorporar una variedad de herramientas en las aplicaciones de análisis en la nube para obtener el mejor ajuste de tecnología, y que él puede "dormir mejor por la noche cuando las cosas se ejecutan en la nube", debido a la alta disponibilidad prometida por los proveedores de plataformas como AWS.

No todo está claro en la nube

Hay algunos problemas con los que lidiar, sin embargo. Elegir entre las tecnologías AWS disponibles para almacenar, procesar y analizar datos en la nube no es un proceso simple, según Gallman.

"Tienes que ser experto en tu equipo para optimizar la configuración de la nube", dijo, advirtiendo que tomar las decisiones equivocadas podría aniquilar el ahorro de costos anticipado en comparación con las implementaciones locales.

Además, dijo que, por motivos de seguridad, el equipo de big data no almacena ninguna información de identificación personal sobre los clientes en la nube. Y Gallman no planea mover todas las aplicaciones del equipo a la nube. El cluster local, basado en la distribución de Hadoop de Hortonworks, continuará siendo utilizado como una plataforma de desarrollo y prueba. Lenovo, que utiliza herramientas de integración de Talend para extraer datos de la arquitectura analítica, también continuará ejecutando algunos trabajos de producción que no requieren resultados rápidos en el modo por lotes del clúster.

La analítica de datos en la nube también va al alza en Autodesk, un desarrollador de software de diseño e ingeniería basado en California. Autodesk ha construido una arquitectura de big data basada en AWS que almacena datos analíticos en S3 para procesar principalmente con el motor de Apache Spark, dijo Mark Eaton, arquitecto empresarial de la compañía. Los analistas de datos y los usuarios de negocios pueden acceder a los datos de S3, así como a los paneles e informes de BI, a través de una capa de virtualización de datos creada con herramientas de Denodo Technologies.

Eaton dijo que la arquitectura basada en la nube, llamada Autodesk Data Platform, actualmente incluye datos sobre cosas tales como las suscripciones de software de los clientes y su uso de los productos de la compañía basados ​​en la web. Citó el mismo tipo de beneficios del uso de la nube para el análisis que Gallman: menores costos, escalabilidad más fácil de los sistemas y mayor agilidad en la adopción de nuevas tecnologías.

Autodesk incluso está conectando sus centros de datos locales directamente con los de AWS que utiliza para permitir una latencia de sub-milisegundos entre ellos, según Eaton.

"Estamos comprometidos con AWS y buscamos pasar más tiempo allí con ellos", dijo. "La pregunta ha cambiado internamente de '¿por qué la nube?', a '¿por qué no la nube?'".

Este artículo se actualizó por última vez en agosto 2017

Profundice más

Inicie la conversación

Envíenme notificaciones cuando otros miembros comenten sobre este artículo.

Enviando esta solicitud usted acepta recibir correos electrónicos de TechTarget y sus socios. Si usted reside afuera de Estados Unidos, esta dando autorización para que transfiramos y procesemos su información personal en Estados Unidos.Privacidad

Por favor cree un Nombre de usuario para poder comentar.

- ANUNCIOS POR GOOGLE

Close