Sergey Nivens - Fotolia

Noticias Manténgase informado sobre las más recientes actualizaciones de productos y noticias de tecnología empresarial.

Big data desafía las técnicas de modelado de datos tradicionales

Big data está cambiando las técnicas de modelado de datos, incluyendo la creación de esquemas. La conclusión de Enterprise Data World 2016: los profesionales de datos se deben ajustar.

La avalancha de big data, con sus altos volúmenes y diversas estructuras de datos, ha dado lugar a nuevas tecnologías en la forma de NoSQL, Hadoop, Spark y similares. NoSQL, en particular, exige cambios en las técnicas de modelado de datos establecidas.

Algún aprendizaje básico es adecuado, también, cuando se trata de bases de datos NoSQL, como MongoDB, Cassandra y Redis, aconsejó al menos un veterano de datos durante la reciente conferencia Enterprise Data World (EDW) 2016 en San Diego.

"Nadie nace sabiendo NoSQL", dijo Ted Hills, un arquitecto de datos empresariales en el proveedor de información LexisNexis, con sede en Nueva York. Los modeladores de datos deben darse cuenta de que todo lo que saben sobre el modelado lógico sigue siendo cierto, continuó, pero también deben darse cuenta de que "NoSQL da una caja de herramientas más ricas", con la cual los desarrolladores pueden trabajar.

Los profesionales de datos deben estar dispuestos a aceptar el cambio, y adoptar las nuevas capacidades de las herramientas de big data, dijo Hills, a pesar de que las herramientas conducen a cambios en los métodos de modelado existentes.

Hills, autor del recientemente publicado NoSQL and SQL Data Modeling, sugirió la necesidad de nuevas notaciones de modelado que adopten la funcionalidad NoSQL.

Técnicas de modelado de datos cumplen con el esquema de escritura

Uno de los efectos del lado NoSQL del desarrollo de big data ha sido aplazar la creación de esquemas. La definición inicial del esquema de datos fue una vez un eje central de las prácticas de calidad de datos, y un requisito previo solo para conseguir poner un proyecto en marcha.

La creación de esquemas puede estar moviéndose a una etapa diferente del ciclo de desarrollo, según Karen Lopez, arquitecta de datos y consultora principal en InfoAdvisors.

"No es que no nos preocupemos por la calidad. Es que no nos estamos preocupando por el esquema inicial", dijo. Esto no significa que los diseños se conviertan en algo "sin esquema". En su lugar, vienen a apoyar algo parecido al modelo de "esquema al leer", dijo.

Hills estuvo de acuerdo, diciendo que el entusiasmo de la gente por NoSQL se templa conforme se preguntan: "¿qué es todo esto con lo que golpeé mi [sistema de gestión de base de datos]?". Él espera que el modelado de datos pase de un modo exclusivamente prescriptivo a uno que incluye algún modelado descriptivo, donde los esquemas de datos se crean después del desarrollo inicial de los datos.

Adoptar lo ágil

El término descriptivo es apto para la arquitectura de datos de hoy, según Lakshmi Randall, un analista independiente y consultor en EDW 2016.

"Ahora, en lo que se refiere al modelado de datos, las cosas son más descriptivas. En lugar de tratar de planificar todo de antemano, se ve casos de uso desarrollados casi sobre la marcha", dijo.

Un tipo de base de datos NoSQL puede estar particularmente relacionada con este estilo de diseño de datos, dijo Randall. Esta es la base de datos de gráficos.

La base de datos de gráficos NoSQL tiene la capacidad de capturar información sobre las muchas interacciones que se producen en, por ejemplo, la web y los sistemas de relaciones con los clientes, dijo. De esta manera, puede ser muy útil en la creación de un modelo descriptivo de una aplicación de amplio alcance, agregó.

Por su parte, Hills hizo hincapié en que el desafío del diseño NoSQL es parte de una tendencia más amplia para hacer más flexibles a las empresas y al desarrollo de software.

La tendencia lleva el nombre de metodología ágil, y muchos de sus principios –por ejemplo, los proyectos organizados en torno a una entrega temprana, iteraciones cortas pero frecuentes y el uso moderado del esquema por adelantado– son ajenos al modelado tradicional.

Ágil significa que los equipos trabajan en "fragmentos" de proyectos más pequeños que antes, dijo, y la parte comercial de la organización está involucrada en cada paso.

"Los modeladores de datos deben aprender del desarrollo ágil, trabajando en pequeñas carreras de velocidad cortas. Nuestro mundo de modelado de datos tradicional ha sido más un proceso de cascada", dijo Hills, en referencia a un estilo de proyecto que se ha asociado con el desarrollo de varios años.

Hills dijo que no hay nada de malo con empezar a almacenar datos en NoSQL antes de la creación del esquema. Instó a los modeladores de datos a tener la mente abierta al valor de la nueva tecnología.

"No vea eso como un enemigo; véalo como una oportunidad", dijo. "Debe estar en ese equipo de desarrollo ágil, y hablando con el negocio tanto como lo están haciendo sus colegas de desarrollo".

Este artículo se actualizó por última vez en mayo 2016

Profundice más

Inicie la conversación

Envíenme notificaciones cuando otros miembros comenten sobre este artículo.

Por favor cree un Nombre de usuario para poder comentar.

- ANUNCIOS POR GOOGLE

Close