BACKGROUND IMAGE: iSTOCK/GETTY IMAGES

Evaluar Conozca los pros y contras de las tecnologías, productos y proyectos que está considerando.

Almacenes de datos NoSQL ofrecen menú variado para manejar diversos conjuntos de datos

Las bases de datos NoSQL proporcionan alternativas al software relacional para gestionar agrupaciones de big data. Pero los posibles compradores necesitan discernir entre los diversos tipos de tecnologías NoSQL.

En las últimas décadas, la mayoría de los sistemas de procesamiento de transacciones y almacenamiento de datos se han construido sobre sistemas de gestión de bases de datos relacionales. Ahora, sin embargo, muchas organizaciones están ampliando sus capacidades analíticas de maneras que el software relacional no puede soportar; al menos, no de manera óptima.

Por ejemplo, las empresas buscan cada vez más incorporar datos semi-estructurados y no estructurados en sus programas analíticos; eso es difícil de hacer con las bases de datos relacionales, que se orientan principalmente a los datos de transacciones estructuradas. Además, los científicos de datos y otros analistas quieren ejecutar algoritmos analíticos contra todos esos datos, algo que a menudo requiere una plataforma de big data de gran potencia.

Ahí es donde las bases de datos NoSQL entran en la imagen. Ellas proporcionan medios alternativos de gestión, acceso y consulta de datos en comparación con las bases de datos relacionales. También multiplican las opciones de base de datos disponibles para los equipos de TI: Hay diferentes tipos de almacenes de datos NoSQL disponibles para diferentes tipos de aplicaciones, creando una nueva flexibilidad en las arquitecturas analíticas.

Las tecnologías NoSQL permiten que las organizaciones resuelvan dos aspectos de las bases de datos relacionales que restringen la forma en que se pueden utilizar los datos. Primero, los datos en un sistema de gestión de base de datos relacional (RDBMS) se almacenan en una estructura tabular, con cada tabla constituida por registros organizados en filas con un número estático de columnas que producen campos rellenos con valores de datos. En segundo lugar, los datos se organizan de acuerdo con un esquema predefinido que es difícil de ajustar después de que el sistema ha sido puesto en producción.

Las estrictas estructuras y esquemas de las bases de datos relacionales son un buen complemento para las aplicaciones de procesamiento de transacciones, pero se convierten en limitaciones para muchos usos analíticos avanzados. Como resultado, las plataformas RDBMS a menudo no son adecuadas para satisfacer las necesidades de análisis en evolución de las organizaciones.

Menor rigidez en las reglas de modelado de datos

El modelado de datos para la mayoría de los sistemas NoSQL es más relajado. Utilizan un enfoque referido de diversas maneras como modelado sin esquema o modelado de esquema en lectura, en el que la estructura de un esquema está incrustada dentro de cada elemento de datos a medida que se lee. Esto permite una representación de datos más flexible que no está restringida por una estructura de datos estática, simplificando el manejo de conjuntos de datos grandes y diversos, y ampliando los usos potenciales de los datos en diferentes aplicaciones analíticas.

Los entornos NoSQL no son uniformes tampoco: múltiples grupos de tecnologías dispares se denominan colectivamente como productos NoSQL debido a su naturaleza no relacional. Existen cuatro categorías principales de almacenes de datos NoSQL:

Almacenes de valores clave. En estas bases de datos, los objetos de datos están asociados con cadenas de caracteres distintas llamadas llaves, similar a la estructura de datos conocida como matriz asociativa. El par clave-valor es un concepto relativamente simple para las arquitecturas NoSQL, por medio del cual se utilizan claves únicas para indexar entidades con valores atribuidos. Es importante destacar que, debido a que un almacén de valores clave no impone ninguna restricción al tipo o formato de los elementos de datos, las aplicaciones son libres de interpretar la semántica de datos sobre la marcha.

Bases de datos de documentos. Al igual que en los almacenes de valores clave, los objetos de datos en una base de datos de documentos se asocian y se acceden mediante claves de cadena de caracteres. Sin embargo, los elementos se almacenan en un formato similar al documento y tienen cierta estructura. Soportan diferentes codificaciones estándar, incluyendo lenguaje de marcado extensible; JSON; y BSON, que es una codificación binaria de objetos JSON. Las bases de datos de documentos también incorporan metadatos sobre elementos de datos, ayudando a simplificar el proceso de consulta de datos basado en su contenido.

Almacenes de tabla o de columna ancha. El modelo de almacén de columnas anchas desciende del diseño de la base de datos Bigtable de Google, que se detalló en un documento de investigación de 2006, y que todavía se utiliza en Google para ejecutar su motor de búsqueda y otras aplicaciones principales. Los almacenes de columnas anchas distribuyen datos entre tablas con numerosas columnas para ayudar a acelerar la consulta de volúmenes de datos muy grandes. Las columnas se basan en pares clave-valor y no necesitan ser idénticas en cada fila de una tabla, proporcionando mayor flexibilidad para almacenar diversos conjuntos de datos.

Bases de datos de gráficos. Estas son una especie de animal diferente que los tres tipos previos de base de datos NoSQL. Las bases de datos de gráficos trazan las relaciones entre entidades de datos en forma de gráfico, organizándolas como redes de nodos interconectados con etiquetas que describen cómo los nodos están relacionados entre sí. Los gráficos pueden seguir creciendo en tamaño y complejidad a medida que se recopilan más datos y se amplía el número de nodos y conexiones.

Incluso más almacenes de datos NoSQL

Otros tipos de almacenes de datos también se clasifican como software NoSQL, por ejemplo, bases de datos de objetos que proporcionan un enfoque híbrido diseñado para puentear la gestión de datos sin esquema y los modelos de datos relacionales tradicionales. Los proveedores de NoSQL combinan cada vez más los diferentes estilos de tecnología en ofertas de productos unificados, creando bases de datos multimodales que pueden soportar una combinación de modelos de datos y aplicaciones. Esto permite potencialmente que los equipos de TI obtengan la flexibilidad de las arquitecturas NoSQL sin tener que desplegar múltiples sistemas de administración de bases de datos.

En general, los almacenes de datos NoSQL proporcionan mayor elasticidad en el uso de computación, almacenamiento y ancho de banda de red. A diferencia de las bases de datos relacionales, no obligan a que los datos se almacenen persistentemente en formatos o ubicaciones físicas particulares. Muchos también admiten el almacenamiento de datos integrado que ayuda a reducir la latencia de los datos y acelera el rendimiento del procesamiento en un sistema configurado con suficiente memoria.

Como resultado, los sistemas NoSQL pueden ofrecer un rendimiento rápido tanto para la ingesta como para la consulta de datos, así como una escalabilidad mejorada para soportar la recopilación y administración de cantidades masivas de datos.

Investigue más sobre Bases de datos

Inicie la conversación

Envíenme notificaciones cuando otros miembros comenten sobre este artículo.

Por favor cree un Nombre de usuario para poder comentar.

- ANUNCIOS POR GOOGLE

Close