Evaluar Conozca los pros y contras de las tecnologías, productos y proyectos que está considerando.

Cómo dominar la virtualización del almacenamiento

Dónde debe residir la virtualización del almacenamiento y cómo se debe aplicar depende del tamaño de la infraestructura del almacenamiento, del tipo de aplicaciones que se ejecuten y de los niveles de control y de visibilidad requeridos por los administradores. Nosotros analizamos los principales productos de virtualización del almacenamiento y le ayudamos a decidir qué tecnología puede ser la mejor para el almacenamiento de su empresa.

Existen varias formas de incrustar la virtualización en su infraestructura de almacenamiento. A continuación se enumeran las ventajas y desventajas de los distintos métodos.

La virtualización se muestra en todas las capas de la infraestructura de almacenamiento. La virtualización de bloques basada en un sistema de almacenamiento, host y red puede simplificar la gestión de volúmenes, facilitar las migraciones de datos y disminuir los tiempos de aprovisionamiento de almacenamiento, pero todos ellos aumentan la complejidad de la gestión de un entorno de almacenamiento. Como la infraestructura de almacenamiento es cada vez más abstracta, es posible que las organizaciones no puedan señalar con seguridad qué datos residen en qué dispositivo de almacenamiento o cómo aislar la causa raíz de los problemas.

Dónde incrustar la virtualización y cuándo utilizarla depende del tamaño de la infraestructura, del tipo de aplicaciones que corren en ella y de los niveles de control y visibilidad requeridos por los administradores.

Hoy día, los gestores de almacenamiento necesitan equilibrar los beneficios de la virtualización con la complejidad que acarrea. Analizaremos siete de los mayores suministradores de virtualización de almacenamiento de Norte América. Cada suministrador ofrece virtualización de almacenamiento en una o más capas de la infraestructura de almacenamiento, así como el software de la gestión de recursos de almacenamiento (SRM) complementario que proporciona visibilidad, notificación y gestión a través de las múltiples capas de la infraestructura de almacenamiento virtual.

En relación con las preguntas sobre cuál es el mejor lugar para implementar la virtualización o a qué nivel o qué cantidad hay que virtualizar, no hay una respuesta correcta. Básicamente, los usuarios pueden elegir uno de los tres métodos para cubrir sus necesidades combinadas de virtualización de almacenamiento y software SRM:

-Único suministrador

-Basado en el host

-Combinación de software

Método de suministrador único
El método de suministrador único implica que si compra todos sus dispositivos de almacenamiento a un único suministrador, la virtualización funcionará bien. Tanto EMC Corp. como IBM Corp. promocionan activamente esta forma de dependencia cuando los clientes adquieren sistemas de almacenamiento Symmetrix de EMC y System Storage DS8000 de IBM y después instalan en sus servidores el software de gestión de trayectos PowerPath de EMC y el Controlador de dispositivos de subsistemas (SDD) de IBM.

Este software de gestión de trayectos complementa la virtualización basada en host mediante la identificación de las características específicas de los LUN presentados por los sistemas de almacenamiento de EMC y de IBM, como qué controlador de almacenamiento es el controlador primario en una configuración activa dual, y el envío de tráfico de entrada/salida a dicho controlador. Entonces el software de gestión de trayectos funciona con gestores de volumen del sistema operativo nativo para combinar los LUN del sistema de almacenamiento que se proporcionan a dos o más trayectos del canal de fibra (FC), de forma que el gestor de volumen del trayecto crea que es el mismo LUN. También proporciona balanceo de carga y recuperación ante fallos de trayectos en los distintos trayectos del FC al LUN.

Pero, una vez que se instala el software de gestión de trayectos de un suministrador concreto, es más difícil añadir sistemas de almacenamiento o productos de virtualización basado en red de otros suministradores. El software del SDD de IBM sólo funciona con sistemas de almacenamiento de IBM o con el producto basado en red de IBM System Storage SAN Volume Controller (SVC). El PowerPath soporta los sistemas de almacenamiento Symmetrix y Clariion de EMC, así como el almacenamiento de alta gama de Hewlett-PackaDR (HP) Co., Hitachi Data Systems (HDS) e IBM.

La capacidad limitada del software de gestión de trayectos para trabajar con otros sistemas de almacenamiento literalmente obliga a los usuarios a adoptar el Invista de EMC o el SVC de IBM con el fin de virtualizar sus entornos. Aunque de algún modo Invista y SVC debilitan el esfuerzo de EMC y de IBM para que las empresas compren únicamente sus sistemas de almacenamiento, las compañías pueden decidir seleccionar sus productos de virtualización de almacenamiento basados en red según el software de gestión de trayectos que ya tengan instalados.

El impulso detrás de las iniciativas de virtualización de almacenamiento basado en red y de software de SRM de EMC e IBM no se debe totalmente a poder virtualizar y gestionar sistemas de almacenamiento de otros suministradores. Parte de este esfuerzo para virtualizar sus propios sistemas de almacenamiento es que los usuarios migren y coloquen de modo más sencillo datos en sistemas de almacenamiento de otros suministradores que son propiedad del usuario y, a continuación, utilicen el software de SRM de EMC o de IBM para la supervisión y gestión en curso de la infraestructura de datos, del almacenamiento y de la aplicación virtualizada del usuario.

Según Jim Rymarczyk, socio de IBM y técnico jefe de virtualización, hace unos diez años la mayor parte del costo de la infraestructura de almacenamiento estaba asociada con la adquisición de dispositivos de almacenamiento. En la actualidad, hasta el 70% de esos costos están asociados con la gestión. Mientras que la virtualización y el software de SRM pueden aliviar estos costos de gestión, intentar llevar a cabo una gestión extremo a extremo en una red de almacenamiento heterogénea puede conllevar muchos problemas.

El problema más grave que genera la virtualización en redes de almacenamiento heterogéneas es la incapacidad de relacionar de la forma correcta qué datos de las aplicaciones residen en qué discos concretos. Como cada capa de virtualización abstrae aún más los datos procedentes del disco subyacente con el fin de simplificar la gestión, se pieDRe cierta información, como los niveles RAID del sistema de almacenamiento o las configuraciones del controlador (necesarios para optimizar el rendimiento y para resolver los fallos). El poder acceder a esta información y volver a relacionarla con la aplicación casi siempre requiere acceder a las API de los sistemas de almacenamiento.

Estos problemas han derivado en que EMC e IBM desarrollen sus respectivos conjuntos de software de SRM del Centro de control y del Centro de productividad de almacenamiento total (TPC) con el fin de integrarlos de la mejor forma posible con sus propios productos de haDRware y software. Mientras que el software de SRM de EMC e IBM soporta SMI-S y API de otros sistemas de almacenamiento, Rymarczyk admite que si utilizan el software de SRM de IBM «los clientes peDRerán parte de su libertad para elegir el almacenamiento de otros suministradores».

EMC e IBM tomaron decisiones muy distintas en relación con las arquitecturas de sus productos de virtualización de almacenamiento basado en red. El Invista de EMC es una arquitectura de trayecto dividido que coloca el código de virtualización de almacenamiento en una estación de trabajo de gestión o control de rutas de acceso que reside fuera de la SAN del canal de fibra. Los valores de la virtualización se configuran en la estación de trabajo de control de rutas de acceso, que a su vez carga el código en un conmutador del FC sin cache denominado controlador de rutas de datos, como el AP7420 de Brocade o un director blade como el Módulo de servicios de almacenamiento (SSM) serie MDS 9000 de Cisco Systems Inc.

Doc D'Errico, VP y director general del grupo de software de infraestructura de EMC, explica que este método «sin estado» conserva la inteligencia en los sistemas de almacenamiento ya que los sistemas de almacenamiento realizan otras tareas como la replicación y la optimización de datos. Si se eliminara toda la inteligencia del sistema de almacenamiento y se colocara en un equipo, los usuarios peDRerían algunos de los beneficios inherentes proporcionados por los sistemas de almacenamiento. Mantener la inteligencia en los sistemas de almacenamiento también evita que los usuarios se comprometan a largo plazo con la virtualización basada en red. «Los usuarios pueden transitar por la virtualización basada en red más fácilmente usando Invista,» comenta D'Errico de EMC.

La nueva versión 2.0 de Invista soluciona algunas de las deficiencias de la primera versión, donde se consideró que la falta de redundancia física en sus estaciones de trabajo de control de rutas de acceso era una debilidad potencial. Invista 2.0 crea el Control Path Cluster (CPC) [clúster de rutas de control] que está separada físicamente por las distancias del canal de fibra. Por lo tanto, si la estación de trabajo 1 de la CPC falla, la estación de trabajo 2 de la CPC puede encargarse. Invista 2.0 también se beneficia de las funciones de balanceo de carga del PowerPath de forma que pueda equilibrar la carga de modo dinámico entre el controlador de trayecto de datos y los sistemas de almacenamiento de segundo plano.

Tanto Invista como SVC requieren la incorporación de nuevos dispositivos en el trayecto de datos. Para instalar estos dispositivos, un administrador de almacenamiento necesita detener el procesamiento de las aplicaciones, reconfigurar físicamente los cables de la SAN del FC y, a continuación, cambiar la división por zonas de la SAN del FC y de los valores de enmascaramiento LUN del sistema de almacenamiento para introducir en el trayecto de datos el software de virtualización basado en red.

La ausencia del cache en el Invista de EMC implica otros retos a largo plazo. Hace que Invista se demore mínimamente, si es que no lo excluye, en soportar funciones como la replicación asíncrona o el "thin provisioning" ya que estas tecnologías normalmente se basan en el cache para poder funcionar. EMC planea añadir este "thin provisioning" al Invista a finales de 2008, pero recomienda que los usuarios adopten su producto RecoverPoint si necesitan realizar una replicación asíncrona entre distintos sistemas de almacenamiento.

El SVC de IBM se asemeja más a un controlador del sistema de almacenamiento ya que utiliza el cache en su arquitectura. El código de virtualización de almacenamiento del SVC reside en servidores Linux que están desplegados en configuraciones clústers y replican las entradas/salidas sobre puertos del FC entre el cache en el par clusterizado. Soporta cuatro pares agrupados de servidores en una configuración lógica, con cada par clusterizado operando de forma independiente del resto.

Chris Saul, director de marketing del SVC de IBM, recomienda a los usuarios que primero lleven a cabo un ejercicio de planificación de capacidad antes de implementar el SVC. IBM es consciente de los problemas de congestión que pueden surgir si los usuarios insertan el SVC en una malla existente de SAN del FC y no aíslan los SVC de los dispositivos que provocan la congestión como la unidad de cinta. A veces, el SVC se inserta en un diseño core-to-edge (extremo a extremo) que genera una tensión excesiva en los enlaces entre conmutadores (ISL) que, según Saul, «aumenta los cambios de congestión de los ISL.

Método basado en host
Los gestores de almacenamiento a menudo no se pueden estandarizar en los almacenamientos de uno o dos suministradores; en su lugar, tendrán que virtualizar y gestionar la fusión del almacenamiento que ha acumulado su empresa a lo largo de los años. En estos tipos de casos, la mejor opción es seleccionar un producto de virtualización de almacenamiento y el software de SRM que virtualiza y gestiona los recursos de almacenamiento del host.

Por ejemplo, el Veritas Storage Foundation de Symantec Corp. proporciona una forma común de virtualizar un entorno heterogéneo de sistemas de almacenamiento o de productos de virtualización de almacenamiento basado en red en el host. Utilizando el Veritas Storage Foundation, las empresas pueden virtualizar y gestionar su almacenamiento de la misma forma en todas sus plataformas sin necesidad de aprender a operar los gestores de volumen específicos del sistema. Entonces, los usuarios pueden gestionar las aplicaciones y los dispositivos de almacenamiento usando el software de SRM Veritas CommandCentral Storage de Symantec mientras que se obtienen ventajas adicionales de gestión en hosts que corren Veritas Storage Foundation.

En 2006, Symantec mejoró de forma significativa su función de gestión de trayectos de DMP (Multitrayecto dinámico) del Veritas Storage Foundation 5.0. En versiones anteriores a la 5.0, el DMP solamente proporcionaba un algoritmo de gestión de trayectos round-robin (Algoritmo de Planificación por Turno Rotatorio) ; ahora, los administradores pueden escoger entre siete algoritmos diferentes para realizar la gestión de trayectos. Su nuevo valor por defecto es buscar la longitud de cola mínima en cada trayecto del FC, identificar el trayecto con menos tráfico y después enviar el tráfico de entrada/salida a través de ese trayecto.

El DMP 5.0 también mejora su función de detección de errores y de descubrimiento de volúmenes sorteando al sistema operativo cuando se gestionan trayectos específicos del FC y se comunica directamente con los adaptadores de bus del host (HBA) del FC usando sus API. Trabajando con los HBA, el DMP puede identificar comandos o tiempos límite específicos de la SCSI emitidos por los sistemas de almacenamiento. Normalmente, los HBA del FC los reciben pero no los transfieren a los gestores de volúmenes ni al sistema operativo; sin embargo, el DMP puede identificar problemas específicos del trayecto del FC o errores de accesos no autorizados al sistema de almacenamiento y utilizar trayectos alternativos para acceder a los LUN en sistemas de almacenamiento de segundo plano .

El DMP también puede detectar cómo los distintos productos de virtualización de almacenamiento presentan los LUN al host. Los LUN se pueden presentar por medio de controladores de almacenamiento en estados activo-activo (A/A) o activo-pasivo (A/P), que impacta en cómo los procesa el gestor de volúmenes del Veritas Storage Foundation. Los LUN en estado A/A son más fáciles de gestionar ya que, si el LUN no está disponible en un trayecto, el gestor de volúmenes simplemente puede intentar acceder al LUN en un trayecto alternativo.

Y a la inversa, los LUN en estado A/P se asignan y gestionan mediante un controlador específico del sistema de almacenamiento; sin embargo, si dicho controlador no está disponible, no es tan simple como conmutarse a otro trayecto ya que se pueden producir errores de accesos no autorizados en el sistema de almacenamiento. Mediante la monitorización de los comandos del FC emitidos por la virtualización basada en el sistema de almacenamiento o basada en red y recibidos por el HBA del FC, el DMP puede establecer qué trayecto alternativo utilizar para acceder al LUN sin provocar un error de acceso no autorizado del sistema de almacenamiento.

La ampliación de la virtualización del servidor también llevó a Symantec a soportar Veritas Volume Manager (VxVM) de Veritas Storage Foundation directamente en el nivel de hipervisor empezando por el gestor de recursos Solaris Logical Domains (LDoms)  de Sun Microsystems Inc. Por defecto, el gestor de recursos LDom Solaris nativo de Sun virtualiza los volúmenes de almacenamiento y los HBA del FC que recibe, que después se presentan como volúmenes virtuales y HBA a sus hosts virtuales.

El gestor de Veritas Storage Foundation de Symantec, utilizado junto con el VxVM, permite que los administradores gestionen hasta un máximo de 3.000 hosts desde una única consola Web, incluyendo hosts como el Ldom de Sun. Igualmente, cuando se utiliza el Veritas Storage Foundation con el Veritas CommandCentral, los administradores de almacenamiento pueden establecer correspondencias entre recursos virtuales asignados a los recursos físicos.

En este momento, Symantec aún no tiene una fecha oficial de cuándo se va a completar la integración con el servidor ESX de Vmware. Sean Derrington, director de gestión de almacenamiento de Symantec, explica que Symantec espera aún tener acceso a las API del servidor ESX de VMware antes de que pueda llevar su VxVM al hipervisor de ESX. Una vez que Symantec disponga de las API del ESX, «estaremos ahí,» contesta Derrington.

Método de software mixto
Algunas empresas pueden considerar que necesitan una combinación de virtualización de almacenamiento y de software de SRM para virtualizar y gestionar datos en múltiples puntos dentro de la infraestructura de almacenamiento. HDS, HP, Network Appliance (NetApp) Inc. y Sun utilizan controladores del sistema de almacenamiento para virtualizar sus propios sistemas de almacenamiento y los de otros suministradores. Mientras NetApp utiliza sus propias plataformas V-Series para virtualizar otros sistemas, tanto HDS, HP como Sun emplean la Plataforma de almacenamiento universal (USP) V de HDS.

HP tiene un acueDRo de ingeniería y de OEM con HDS según el cual las dos empresas desarrollan en conjunto las series V de XP y USP. Los comentarios, sugerencias, modificaciones y contribuciones recibidas de HP se incorporan en una única versión del firmware HDS que a continuación se incluye en todas las versiones de los productos V de XP/USP. Las únicas diferencias entre el software en la serie V de XP y USP son las cadenas ID incluidas en el firmware. HP utiliza estas ID para crear soluciones de recuperación ante desastres que funcionan únicamente con el XP, comenta James Wilson, director del producto XP de HP.

Hu Yoshida, CTO de HDS, indica que su compañía ha decidido específicamente quedarse fuera de la malla de la red ya que está intentando satisfacer requisitos específicos de los clientes en cuanto a la alta disponibilidad y al rendimiento y entregar funciones concretas que los equipos basados en red no pueden satisfacer. A diferencia de los equipos basados en red, que pieDRen el 50% de su rendimiento en el caso de que falle un equipo y que tienen una cantidad limitada de cache o ninguna, el V de USP puede crear una cache que abarque múltiples controladores y procesadores.

Un V USP totalmente configurado puede peDRer hasta cuatro procesadores y aún tener acceso al cache común sin péDRida de datos, explica Yoshida.

HDS, HP, NetApp y Sun ofrecen un conjunto de productos de SRM para gestionar sus propios sistemas de almacenamiento y otro conjunto de herramientas de SRM para gestionar entornos SAN heterogéneos. HP divide su software de SRM en tres categorías: almacenamiento unificado y gestión de servidores, gestión de elementos y gestión de rendimiento. Si usted sólo necesita gestionar los productos de almacenamiento de HP, entonces las clase de software de gestión de elementos y de gestión de rendimiento de HP probablemente cumplirán sus requisitos. Y a la inversa, si una empresa intenta gestionar un entorno de almacenamiento heterogéneo, necesitará después introducir el producto Storage Essentials de HP con el fin de proporcionar este nivel de gestión de servidores y almacenamiento.

Los suministradores cada vez más tienden a unir juntos su software de SRM y su virtualización de almacenamiento. Pero debido al tiempo y a esfuerzo requeridos para implementar la virtualización y el software de SRM complementario, se deberían desplegar gradualmente productos de virtualización mientras mantiene sus expectativas a un nivel modesto.

Investigue más sobre Almacenamiento empresarial

Inicie la conversación

Envíenme notificaciones cuando otros miembros comenten sobre este artículo.

Por favor cree un Nombre de usuario para poder comentar.

- ANUNCIOS POR GOOGLE

Close