BACKGROUND IMAGE: iSTOCK/GETTY IMAGES

Evaluar Conozca los pros y contras de las tecnologías, productos y proyectos que está considerando.

Nuevo escenario de datos augura arquitecturas basadas en descubrimiento

En una entrevista, la consultora Lakshmi Randall prevé cambios en cómo se organiza y ejecuta la gestión de datos conforme el paisaje global de datos cambia debido a la adopción de sistemas de big data.

Los cambios en el panorama de datos en los últimos años tienen ramificaciones que no son inmediatamente evidentes. Algunos principios básicos de la profesión de datos están siendo sometidos a revisión a medida que proliferan los sistemas de big data. Por lo menos, estos cambios requieren flexibilidad por parte de los profesionales de datos, de acuerdo con Lakshmi Randall, directora de la consultora Unabashed Advice. En más de 19 años, ella se ha centrado en gran medida en la preparación de datos y los problemas de calidad. Nos encontramos con ella después de su aparición en un panel que enfrentó a los almacenes de datos contra los lagos de datos en el reciente evento Enterprise Data World 2016 en San Diego.

Supongo que enfrentar a los almacenes de datos contra los lagos de datos tiene un propósito. ¿Pero no es solo un hecho que el panorama de datos está cambiando? Con esto en mente, ¿cómo ve la relación entre el almacén y el lago hoy?

Lakshmi Randall: Lo que se está descomponiendo es un enfoque estrictamente lineal para la gestión y análisis de datos. Es decir, uno en el que los datos viajan por un camino de paso a paso desde la adquisición hasta el conocimiento. Funciona cuando usted entiende los datos, cuando está predominantemente estructurado y se origina desde fuentes de datos familiares.

Pero en el caso de big data –notas de un médico o datos de los formularios de reclamaciones de seguros– los datos están semi-estructurados o no estructurados, por lo que el enfoque lineal ya no es factible. Estos ejemplos requieren el descubrimiento de las fuentes de datos, archivar los datos y facilitar la comprensión de los datos antes de decidir sobre la ruta hacia el conocimiento.

Usted podría moverlo al almacén de datos o, después del proceso de descubrimiento, puede encontrar que no es útil y lo descartará. Creo que con el cambio en el paisaje de datos, usted tiene que pensar en algo más que solo el enfoque lineal. En vez de eso, tiene que pensar también en enfoques de descubrimiento y exploratorios. Sobre la base de eso, debe decidir sobre las próximas mejores acciones, ya sea para el procesamiento o el almacenamiento de los datos.

Lakshmi Randall

A medida que el paisaje de datos está cambiando, estamos viendo nuevos tipos de datos. Debemos estar abiertos a diferentes arquitecturas, donde sea apropiado. El gobierno de datos sigue siendo una clave, pero se debe tener cierto nivel de agilidad y flexibilidad también.

Parece una necesidad creciente que TI apoye a un usuario algo diferente de lo que podían tener en el pasado, algo así como un usuario avanzado con esteroides, se podría decir.

Randall: Bueno, diferentes casos de uso impulsan las diferentes tácticas. Los datos se convierte en parte de un proceso más iterativo. Los personajes que deben ser soportados cambian. No es solo un personaje que hace normalmente el análisis del día a día. Puede ser lo que se llama un usuario avanzado o un usuario de descubrimiento de datos o un científico de datos. Puede ser alguien que combina las habilidades de conocimiento de dominio junto con algún nivel de conocimiento técnico, un personaje híbrido. Realmente, hay una necesidad de una continuidad de personajes en la empresa.

Veamos otro aspecto del paisaje datos: NoSQL. ¿Cuáles son algunos factores que impulsan el interés en el uso de NoSQL?

Randall: Cuando está modelando datos que contienen verdaderas relaciones –las que son más impulsadas por afinidad– el modelado de datos es diferente de lo que es con una base de datos relacional tradicional. Esto es un gran ejemplo de la necesidad de una base de datos NoSQL.

Por ejemplo, como parte de una solución de gestión de la experiencia del cliente, hay diferentes puntos de contacto en el recorrido del cliente. Estos pueden ser a través de muchos canales diferentes. Y encontrar esas conexiones especiales, creo, solo es posible si tenemos NoSQL, dado que almacena los datos en algo cercano a su forma natural. Eso es, en contraposición a tener que traducir los datos en filas y columnas. Las personas están encontrando que hay algunos casos de uso, como éste, que son muy buenos candidatos para las bases de datos NoSQL. Todo tiene que ver con la naturaleza de los datos. Si se trata de datos relacionales, entonces las bases de datos relacionales y los almacenes de datos son mejores candidatos.

En su experiencia en los últimos tiempos, ¿dónde está la profesión de datos en todo esto? Por ejemplo, con la gobernabilidad y el modelado, puede haber una inclinación natural a pedir un control más adelantado. ¿Está viendo cambios en la forma en que los equipos se están organizando?

Randall: El negocio se justifica en la exigencia de la capacidad de realizar análisis ad-hoc o de tener acceso a los datos adecuados y pertinentes con el fin de acelerar el tiempo al conocimiento. Al mismo tiempo, el negocio debe ser uno de los patrocinadores de TI en el establecimiento de las iniciativas de gobierno y administración.

Hoy en día, la profesión de datos se extiende a través de TI y del negocio. Y la realidad es la empresa necesita una continuidad de personajes –eso significa personas con habilidades cuantitativas, habilidades cualitativas, expertos de dominio, expertos de procesos, científicos de datos, administradores de datos y así sucesivamente– para apoyar la multitud de objetivos del negocio.

Inicie la conversación

Envíenme notificaciones cuando otros miembros comenten sobre este artículo.

Por favor cree un Nombre de usuario para poder comentar.

- ANUNCIOS POR GOOGLE

Close