kras99 - Fotolia

Evaluar Conozca los pros y contras de las tecnologías, productos y proyectos que está considerando.

Cómo elegir el método correcto de instantáneas

Las instantáneas y la replicación se han convertido en las herramientas elegidas de protección de datos, pero encontrar el método adecuado de instantáneas para su centro de datos puede ser un reto.

Los profesionales de TI están contando cada vez más con las instantáneas como una forma de proteger los datos en su entorno virtual. En cuestión de segundos, las instantáneas proporcionan una instancia de datos secundaria congelada. Esta instancia puede ser respaldada, replicada o incluso utilizada como línea de base para iniciar otra máquina virtual (VM).

Sin embargo, hay dos retos al contar con instantáneas para la protección de datos. En primer lugar, una instantánea es una instancia, no una copia completa. En segundo lugar, las instantáneas se pueden implementar en la VM, el hipervisor, el software de respaldo o la matriz de almacenamiento. Decidir qué ubicación debería desencadenar y gestionar la instantánea puede ser confuso. En este artículo, descubrirá cómo superar la debilidad inherente a las instantáneas y cómo seleccionar el método adecuado de instantánea para su centro de datos.

¿Qué es una instantánea (snapshot)?

Las instantáneas aprovechan la forma en que los datos están organizados en un dispositivo de almacenamiento para crear una instancia de un punto en el tiempo del conjunto de datos original. La mayoría de los sistemas de archivos y sistemas de almacenamiento tienen un método de organización de dos niveles para los datos. El primer nivel son los metadatos. La capa de metadatos es un pequeño catálogo que apunta al segundo nivel, la ubicación real de los datos en el disco.

En lugar de copiar todos los datos físicos en el nivel 2, las instantáneas solo copian los metadatos en el nivel 1. Esa copia se hace casi al instante, y toma muy poca capacidad de almacenamiento adicional. A continuación, los bloques que forman parte de la instantánea se establecen como solo de lectura. De cara al futuro, el gestor de instantáneas mantiene dos copias de los metadatos, una copia activa que las aplicaciones de producción continuarán actualizando, y una copia estática, utilizada por otras aplicaciones como copia de seguridad, replicación y así sucesivamente. El número de copias de metadatos crece con el número de instantáneas activas.

Un diferenciador importante para las tecnologías de instantáneas es la forma en que manejan la modificación de un bloque de datos hecha por las aplicaciones de producción o los usuarios. Las instantáneas utilizarán típicamente uno de dos métodos para gestionar los cambios, manteniendo la integridad de instantáneas. La primera opción copia los datos antiguos a una nueva ubicación,  actualizando los metadatos de la instantánea para permitir el acceso al bloque viejo. La segunda opción escribe el bloque modificado en una nueva ubicación y actualiza la copia activa de metadatos. Por supuesto, cada producto tiene sus propios matices, pero, en general, caen en uno de estos dos tipos.

En cualquier caso, el conjunto de datos de la instantánea depende por completo de que la copia principal sea accesible y el consumo de espacio se produzca conforme aumente el número de instantáneas y el tiempo durante el cual esas instantáneas son retenidas. 

Instantánea + replicación

Debido a que las instantáneas son totalmente dependientes del conjunto de datos de origen, si ese conjunto de datos de origen se pierde, debido a un fallo de la infraestructura de almacenamiento o en el sitio, también se pierden las copias instantáneas. Así pues, esta vulnerabilidad deja el caso de uso de instantáneas limitado a la recuperación de la corrupción de datos o al borrado accidental de archivos.

Sin embargo, ya que las instantáneas rastrean los cambios a nivel de bloque, la tecnología también se puede utilizar para replicar datos de manera eficiente. Las replicación basada en instantáneas solo copia los bloques que han cambiado desde la instantánea original. Después de la replicación inicial de datos, estas pequeñas transferencias de bloques son ideales para la actualización de un sistema conectado por WAN situado en otro centro de datos. Y en este escenario, las instantáneas residen en un sistema secundario, por lo que ya no dependen del sistema principal de los datos.

Esta independencia hace esencial a la replicación para tomar instantáneas útiles para un conjunto más amplio de casos de uso de protección de datos. Otra opción es copiar los datos de la instantánea a un sistema secundario en el centro de datos principal, además de en un sistema fuera de las instalaciones. Entonces, si falla el sistema de almacenamiento primario, el sistema secundario en el sitio cuenta con todos los datos protegidos para restauraciones rápidas, mientras que el sistema fuera de las instalaciones dispone de todos los datos para la recuperación de desastres. Dependiendo del tipo de administrador de instantáneas seleccionado, ese sistema secundario podría ser menos costoso, lo que podría reducir los costos.

Por tanto, ¿qué es un administrador de instantáneas?

Un administrador de instantáneas es el software que desencadena la instantánea y gestiona las múltiples copias de los metadatos, manteniéndolos al día conforme cambia el conjunto de datos activos. El administrador de instantáneas es, a menudo, parte de otra cosa, como una aplicación, un sistema de archivos, hipervisor, plataforma de almacenamiento definido por software o matriz de almacenamiento físico. Cada una de estas implementaciones tiene ventajas únicas, y muchos centros de datos optarán por utilizar una mezcla de productos con el fin de cumplir sus objetivos de protección de datos y recuperación de datos.

Instantáneas de aplicación

Algunas aplicaciones tienen la capacidad de crear y gestionar instantáneas y trabajos de replicación para los datos que crean. Además, las instantáneas y las utilidades de replicación de terceros se construyen a menudo para aplicaciones específicas. Aunque de alcance limitado, estos productos tienen la ventaja del conocimiento de las aplicaciones. Ellos pueden poner con gracia una aplicación en un estado de inmovilidad, mientras monitorean los procesos específicos para confirmar que la base de datos todavía está encendida y funcionando. Si uno de estos procesos deja de responder, la instantánea puede desencadenar una recuperación automática. Otra ventaja del método de instantáneas con reconocimiento de aplicaciones es que estos productos pueden dirigir los datos replicados a casi cualquier dispositivo de almacenamiento secundario, lo que potencialmente reduce los costos generales de almacenamiento. El inconveniente es que estos productos se limitan a la(s) aplicación(es) que soportan, lo que significa que el centro de datos puede requerir un proceso de instantáneas separado para cada aplicación.

Instantáneas del sistema de archivos

Cada vez más, las capacidades de instantáneas se están incorporados en los sistemas de archivos. Este método de instantáneas es similar al de las instantáneas de aplicación, pero opera en todo el sistema de archivos en lugar de solo en una aplicación. Esto es importante, porque las API del sistema de archivos se pueden usar para disparar instantáneas de aplicaciones, en modo inactivo. Estas instantáneas trabajan a través de aplicaciones, pero se limitan al sistema operativo y la máquina virtual. Esto significa que cada sistema operativo en el entorno requerirá su propia tecnología de instantáneas. Además, la mayoría de las instantáneas del sistema de archivos no se pueden gestionar de forma centralizada. La programación de las instantáneas de cada servidor tiene que ser gestionada y controlada de forma individual. Para centro de datos grande, esto podría llevar a cientos de trabajos de instantáneas individuales a las que hacer seguimiento.

Instantáneas de hipervisor

En un entorno virtual, las instantáneas se pueden activar en la capa del hipervisor, lo que simplifica la gestión de instantáneas. En lugar de realizar y monitorizar instantáneas por máquina virtual y aplicación, el control se consolida hacia el hipervisor. Por ejemplo, las instantáneas de VMware se pueden gestionar desde vCenter. Al igual que las instantáneas de aplicaciones y del sistema de archivos, el objetivo de las instantáneas y la replicación puede ser un sistema de almacenamiento secundario de cualquier fabricante, ya que las instantáneas se implementan a nivel del hipervisor.

Todas las tres tecnologías anteriores (los métodos de instantáneas de aplicación, sistema de archivos e hipervisor) por lo general presentarán problemas de rendimiento según aumente el número y la edad de las instantáneas. Llega el método de instantáneas basadas en almacenamiento.

Instantáneas de la infraestructura de almacenamiento

El método de instantáneas más comúnmente utilizado es a través de la infraestructura de almacenamiento, por lo general realizado por el hardware de almacenamiento. Hay varias ventajas de usar instantáneas basadas en hardware. En primer lugar, las instantáneas se desencadenan por volumen o sistema; hay menos trabajos de instantáneas que gestionar. En segundo lugar, en la mayoría de los casos, cientos de instantáneas se pueden mantener sin impactar significativamente en el rendimiento, gracias a los procesadores de almacenamiento dedicados que manejan las diferentes tablas de metadatos.

La desventaja es que las instantáneas basadas en hardware se limitan a su destino de replicación. En muchos casos, los dos sistemas de almacenamiento deben ser del mismo proveedor de hardware, pero cada vez más, estos proveedores permiten el uso de un sistema de bajo costo del interior de su portafolio como el objetivo secundario. Otro inconveniente es que si el centro de datos tiene varios sistemas de almacenamiento, cada sistema de almacenamiento tendrá su propio gestor de instantáneas que necesita ser monitoreado por separado.

El almacenamiento definido por software (SDS), suponiendo que sea compatible con las instantáneas y replicación, resuelve estos dos problemas al proporcionar un motor común a través de múltiples sistemas. Como resultado, la gestión se consolida en una única interfaz.

Instantáneas de la aplicación de respaldo

Las aplicaciones de respaldo sirven para dos casos de uso en lo que respecta a las instantáneas. En el primer caso de uso, el software realiza y gestiona la instantánea. En el segundo, el software puede desencadenar la instantánea en otro dispositivo, y luego proporcionar una gestión para esa instantánea. En el primer caso, la aplicación respaldo fundamentalmente sustituye las capacidades de instantáneas de todos los otros métodos mencionados anteriormente. En el segundo caso, el software gestiona, orquesta y organiza los datos de la instantánea.

El segundo caso de uso es más interesante. Permite el uso de la mejor tecnología de instantáneas de varios proveedores de hardware, y añade la posibilidad de buscar de manera eficiente los datos dentro de la instantánea. El reto con el segundo caso de uso es que el soporte del sistema de almacenamiento es limitado, pero conforme crezca el soporte, podría ser un caso de uso convincente.

Seleccionar la instantánea adecuada para su entorno virtual

Muchos centros de datos tendrán que utilizar varios métodos de instantáneas. Por ejemplo, el conocimiento de aplicaciones puede ser valioso. En ese caso, puede ser conveniente gestionar instantáneas para aplicaciones de misión crítica por separado, utilizando un método de instantáneas específico de la aplicación.

Además, la mayoría de los grandes centros de datos no será capaz de utilizar las instantáneas de sistemas de archivos o basadas en hipervisor exclusivamente, debido a problemas de rendimiento. Las grandes organizaciones suelen utilizar sistemas de almacenamiento nativo o capacidades de instantáneas del software de respaldo. Sin embargo, las capacidades de instantáneas de los sistemas de archivos y los hipervisores todavía son necesarias, ya que las instantáneas de  almacenamiento y respaldo pueden utilizarlas como un marco para capturar con precisión los datos de la instantánea.

Al seleccionar un método de instantáneas, empiece por seleccionar un enfoque que ofrezca primero la cobertura más amplia posible, y si surgen problemas, seleccione un método de instantáneas adicional que responda a esas necesidades específicas.

Próximos pasos

Más sobre protección de datos y respaldo:

Utilice automatización basada en políticas para mejorar la protección de datos

Tips para su estrategia de respaldo de servidores virtuales

Establezca objetivos de nivel de servicio para DR y protección de datos

Profundice más

Inicie la conversación

Envíenme notificaciones cuando otros miembros comenten sobre este artículo.

Por favor cree un Nombre de usuario para poder comentar.

- ANUNCIOS POR GOOGLE

Close