Evaluar Conozca los pros y contras de las tecnologías, productos y proyectos que está considerando.

Soluciones de virtualización de almacenamiento en la matriz o en la red

La adopción de virtualización de almacenamiento se acelera a medida que desaparecen las barreras anteriores. Soluciones para poder desplegarla.

La adopción de virtualización de almacenamiento ha aumentado a medida que muchas de las barreras anteriores para su implementación han ido cayendo. Hoy dispone de una amplia selección de soluciones de virtualización de almacenamiento si decide implementar la tecnología en la red o en la matriz.

Mientras existen ciertas divergencias sobre la definición exacta, en general la virtualización de almacenamiento se considera una tecnología que ofrece una capacidad de almacenamiento de datos flexible y lógica a los usuarios, al tiempo que abstrae la ubicación física de estos. Es una capa de software que intercepta peticiones de E/S hacia la capacidad lógica y las asigna a las ubicaciones físicas correctas.

En la implementación de virtualización del almacenamiento a nivel más básico, que es a nivel de host, un gestor de volúmenes lógicos permite proporcionar capacidad de almacenamiento a aplicaciones y usuarios. La virtualización de almacenamiento por bloques se implementa con frecuencia debido a la complejidad de la gestión de LUN y de las condiciones de flexibilidad que precisa el aprovisionamiento de almacenamiento, especialmente en entornos multiusuario, aunque también se implementa con sistemas de almacenamiento de archivos. Este artículo habla de tecnologías de virtualización de almacenamiento a nivel de red y de dispositivo de almacenamiento, pero no a nivel de host.

Grupos, LUN y creación de particiones de un proceso tradicional

El proceso de crear grupos de matrices, ubicar los LUN y crear particiones de volúmenes es una forma compleja y poco eficiente de proporcionar almacenamiento, especialmente a la hora de equilibrar el rendimiento y el aprovechamiento de discos físicos presentes en el sistema. Además el proceso de agrandamiento de un volumen host puede ser un largo proceso de copia de datos y de concatenación de LUN. La virtualización del almacenamiento ofrece un sistema mejorado para mantener en orden los requisitos de aprovisionamiento de almacenamiento para las aplicaciones y servidores, al tiempo que reduce el tiempo y los recursos utilizados, permitiendo que los «cerebros» del sistema de almacenamiento puedan ganar de las decisiones. Esta tecnología también puede mejorar el uso del sistema dejando de lado el trabajo de tener que adivinar cuál será la ubicación física, al tiempo que saca provecho de tecnologías como el aprovisionamiento fino.

En principio la virtualización de almacenamiento era una herramienta usada solo para proporcionar y gestionar la eficiencia del almacenamiento. Sin embargo, al segregar el host del almacenamiento físico, la tecnología también permitía disponer de almacenamiento en otro chasis físico (que podía ser de fabricantes distintos) para unirlo de forma lógica en grupos compartidos que son más fáciles de gestionar. Aunque algunos de estos sistemas heterogéneos se usaban para generar volúmenes más grandes que los presentes en cualquier matriz de discos, la mayor parte de los casos de uso utilizaban la virtualización de almacenamiento como una plataforma común de almacenamiento. Esto permitía a los sistemas de almacenamiento actuales ser reasignados y disminuía la sobrecarga vinculada a gestionar distintos silos de almacenamiento, aunque los sistemas de disco físico aún requerían mantenimiento.

La virtualización del almacenamiento puede mejorar el rendimiento ya que los volúmenes host se distribuyen fácilmente entre distintas unidades de disco, lo que podría afectar negativamente a la capacidad de uso. La virtualización también habilita la nivelación de almacenamiento y las migraciones de datos entre dispositivos, incluyendo el transporte de datos viejos a una aplicación de archivo o índices de bases de datos activos a caché de unidad de estado sólido (SSD). Estas acciones normalmente se realizan en función de las políticas establecidas a nivel de host, aplicación o archivo, y el mismo proceso de transferencia de datos puede usarse para mover datos fuera del sitio por razones de recuperación de desastres (DR).

Virtualización basada en dispositivos

Con la arquitectura de escalabilidad vertical tradicional, donde los controladores están separados de las estanterías de disco, la virtualización a nivel de dispositivo de almacenamiento normalmente está integrada en el sistema operativo del controlador. Esta característica estándar permite principalmente poder disponer de una solución práctica para aprovisionar decenas o cientos de terabytes que los sistemas de almacenamiento actuales pueden mantener. La mayoría de los sistemas ofrecen la posibilidad de crear niveles de almacenamiento dentro de un sistema virtualizado o a través de sistemas discretos, usando diferentes tipos de almacenamiento (unidades de rendimiento, unidades de capacidad o SSD) y diferentes niveles de RAID. Algunos también incluyen un motor de directivas y la capacidad de mover bloques de datos de archivo o subarchivo entre los diferentes niveles en función de la actividad, la aplicación y otros. Muchos sistemas permiten que los datos se copien a un segundo chasis para disponer de alta disponibilidad o que se trasladen a un segundo sistema en un sitio remoto para DR. Aunque la mayor parte de los sistemas de almacenamiento incluyen la virtualización, muchos de ellos no son compatibles con el almacenamiento de otros proveedores. Para obtener una solución heterogénea que pueda consolidar sistemas de almacenamiento de distintos proveedores, muchas opciones están basadas en la red.

Virtualización basada en red

Hace algunos años, la sabiduría del almacenamiento convencional era que los servicios de almacenamiento, como la virtualización, y de alguna manera el control de almacenamiento, se basaba en «smart switches» situados en la red de área de almacenamiento (SAN) tarde o temprano. Aunque al menos una de las soluciones de virtualización de almacenamiento se enfoca en esta línea, la implementación de red de las tecnologías de virtualización de almacenamiento normalmente ha estado con aplicaciones. Estas opciones suelen ser controladores de almacenamiento que se incluyen en matriz de discos o sistemas de almacenamiento de proveedores certificados, o es software instalado en servidores proporcionados por el usuario o máquinas virtuales (VM). Las aplicaciones de virtualización de almacenamiento se adjuntan a sistemas de almacenamiento heterogéneos directamente, a través de canal de fibra (FC) o SAN iSCSI, pero la mayor parte de ellos permiten poder usar su propia capacidad de disco. La mayoría de soluciones incluyen servicios de almacenamiento, como el uso compartido de archivos, las instantáneas, la desduplicación de datos, el aprovisionamiento fino, la replicación, la protección continua de datos (CDP), etc.

Virtualización en banda y fuera de banda

En los estados iniciales del ciclo de vida de las tecnologías de virtualización de almacenamiento emergieron dos arquitecturas principales: la virtualización en banda y la virtualización fuera de banda. Las implementaciones en banda establecían un controlador entre los usuarios y el almacenamiento físico o la SAN y entregaban todas las solicitudes de almacenamiento y datos a través de ese controlador. Los productos fuera de banda establecían un controlador de metadatos en la red que reasignaba las solicitudes de almacenamiento a las ubicaciones físicas, pero no trataba con los datos reales. Esto añadía cierta complejidad al proceso pero también reducía la carga de CPU frente a la virtualización en banda. La virtualización fuera de banda también eliminaba la probabilidad de una disrupción asociada con la retirada de un dispositivo en banda, ya que los usuarios están desconectados de sus datos mientras el almacenamiento se reasigna. Actualmente muchas soluciones de virtualización basadas en red usan la arquitectura en banda, principalmente porque la potencia de CPU es relativamente abundante comparado con la que había cuando emergió la virtualización de almacenamiento por primera vez. Otra razón de la popularidad de las soluciones en banda es que son más fáciles de implementar, lo que supone menos tiempo para ponerlas en venta y menos problemas.

Soluciones de virtualización de almacenamiento

La virtualización se ha convertido en una función necesaria para el aprovisionamiento de almacenamiento y está incorporada de algún modo en muchos sistemas de almacenamientos de tamaño medio y grande. Aunque hay muchas variantes entre las matrices y sus tecnologías de virtualización, la mayor parte de esas implementaciones basadas en dispositivos no reconocen la capacidad de disco de otros proveedores. Así que en vez de incluir una larga lista con todos estos sistemas de almacenamiento, evaluaremos algunos sistemas de almacenamiento heterogéneos. A continuación se describen algunos ejemplos heterogéneos de virtualización de almacenamiento implementados en productos de software y hardware disponibles a través de diversos fabricantes.

Virtualización de almacenamiento de archivos

Aunque muchos sistemas de almacenamiento incluyen servicios de archivos, estos virtualizan datos a nivel de bloques. Sin embargo existen soluciones basadas en red que pueden consolidar sistemas independientes de almacenamiento conectado a la red (NAS). Estas aplicaciones ofrecen un nombre global a los usuarios en el front-end y entregan solicitudes de archivos al NAS físico correcto en el back-end. Además, estos sistemas pueden proporcionar nivelación de almacenamiento de archivos y migración, herramientas muy útiles incluso para proveedores de almacenamiento en la nube. Estos son algunos ejemplos de productos de virtualización de archivos:

AutoVirt Inc. promueve un producto de software de virtualización de almacenamiento de archivos fuera de banda que opera en dos servidores Windows o máquinas virtuales (VM). También habilita un nombre global y un motor de directivas para la nivelación de datos, archivos y migración. Al ser un producto fuera de banda, puede ser eliminado del entorno sin mayores consecuencias.

Avere Systems Inc. FXT es una aplicación NAS heterogénea y escalable horizontalmente que se ejecuta en clústeres de hasta 25 módulos 2U, cada uno de los cuales consta principalmente de un almacenamiento de estado sólido (DRAM y unidad de estado sólido). El clúster FXT proporciona soporte a un sistema de archivos en niveles global, frecuentemente cubriendo sistemas NAS de otros proveedores; también permite la virtualización de archivos entre plataformas.

Las soluciones de F5 Network Inc. ARX son una serie de aplicaciones de virtualización de archivos en banda que pueden englobar a diversos dispositivos NAS heterogéneos bajo un nombre global, usando protocolos CIFS y NFS. También permiten un motor de directivas que puede transportar automáticamente archivos entre sistemas NAS, de forma local o en la nube, en función de los atributos de los archivos, las actividades u otros criterios.

DataCore Software Corp. SANsymphony es una solución en banda basada en red que funciona sobre servidores x86 de productos. Admite dispositivos de almacenamiento heterogéneos con canal de fibra (FC), canal de fibra sobre Ethernet (FCoE) o iSCSI y se adjunta a los hosts como almacenamiento FC o iSCSI. Se pueden crear clústeres de múltiples nodos para escalar capacidad y proporcionar alta disponibilidad. El sistema ofrece aplicación remota y servicios de almacenamiento como creación de reflejo sincrónico, CDP, aprovisionamiento fino y almacenamiento en niveles.

EMC Corp. Invista es un producto de software fuera de banda que se ejecuta en dos servidores (denominado Control Path Cluster, o CPC) y trabaja con «switches inteligentes» de Brocade o Cisco. Es capaz de virtualizar almacenamiento de los principales fabricantes, conectándose al almacenamiento y a los servidores host a través de canal de fibra. Invista ofrece creación de reflejo, replicación y clones a un momento dado entre sistemas de almacenamiento.

FalconStor Software Inc. Network Storage Server (NSS), una aplicación en banda basada en red, que se conecta a sistemas de almacenamiento heterogéneos a través de iSCSI, FC o InfiniBand y admite conectividad de host usando canal de fibra o iSCSI. La expansión y la alta disponibilidad se ofrecen conectando múltiples módulos controladores. Además de la replicación WAN optimizada, NSS también ofrece creación de reflejo sincrónico, aprovisionamiento fino, instantáneas y clones.

Hitachi Data Systems’ Universal Storage Platform V (USP V) es un sistema de almacenamiento de nivel 1 que también ofrece conectividad en banda heterogénea a una mayoría de importantes proveedores de almacenamiento. Incorpora el tipo de funciones y servicios propios de una solución de nivel 1, que incluye el aprovisionamiento fino de almacenamiento conectado interna y externamente.

IBM SAN Volume Controller (SVC) es un controlador de virtualización en banda basado en red que se sitúa en la SAN y se conecta a sistemas de almacenamiento heterogéneos a través de iSCSI o FC. Los pares de unidades SVC permiten una alta disponibilidad, y se pueden agrupar hasta ocho nodos para escalar el ancho de banda y la capacidad. Cada módulo SVC incluye la replicación entre los sistemas de almacenamiento y una capacidad de creación de reflejo entre unidades SVC locales o remotas.

NetApp Inc. V-Series Open Storage Controller es un controlador de virtualización en banda, similar a NetApp filer controller, pero configurado para ser compatible con sistemas de almacenamiento heterogéneos. Se adjunta a un FC SAN en el back-end para consolidar todo el almacenamiento deseado de los LUN existentes y los consolida en los LUN de NetApp para un aprovisionamiento de bloque o archivo, igual que lo haría un archivador NetApp convencional.

NetApp ha adquirido recientemente Engenio Storage Virtualization Manager (SVM), un controlador de virtualización en banda basado en red que mantiene sistemas de almacenamiento heterogéneos. Aún debe hacerse pública información sobre cómo NetApp promoverá esta solución.

Manejar con cuidado

Dado que la mayor parte de productos de virtualización de almacenamiento funcionan en banda, es importante tomarse un tiempo para entender el rendimiento eficaz de la aplicación de clúster o de virtualización ya que esto será el factor clave hacia la expansión de capacidad. Además, los servicios o características de almacenamiento también consumirán ciclos de CPU, reduciendo la capacidad efectiva.

La virtualización del almacenamiento es una herramienta muy eficaz para reducir el Capex, mejorando la capacidad de uso o el rendimiento, pero su ventaja más útil es posible que sea en el lado de Opex. Puede facilitar la gestión del almacenamiento, incluso entre plataformas, y reducir la sobrecarga administrativa. La virtualización también puede convertir la expansión del almacenamiento en un proceso relativamente sencillo, normalmente sin tener que desconectar sistemas de almacenamiento ni interrumpir a los usuarios.

Eric Slack es analista senior en Storage Switzerland.

Este artículo se publicó anteriormente en la revista Storage.

Este artículo se actualizó por última vez en noviembre 2012

Profundice más

Inicie la conversación

Envíenme notificaciones cuando otros miembros comenten sobre este artículo.

Por favor cree un Nombre de usuario para poder comentar.

- ANUNCIOS POR GOOGLE

Close