Resolver Problemas Consiga ayuda para problemas específicos con sus proyectos, procesos y tecnologías.

Duplicación de datos basada en matrices de discos: pros y contras

La duplicación de datos basada en matrices de discos suele parecer la forma de duplicación más sencilla con la menor sobrecarga de gestión. Descubra si es adecuada para sus propósitos de recuperación ante desastres.

En el nivel superior, existen tres tipos principales de duplicación de datos que se utilizan de forma frecuente:  duplicación de datos basada en la aplicación, en el host y en la matriz de almacenamiento. De hecho, podríamos ser todavía más detallistas y subdividir la duplicación basada en matrices dependiendo de si tiene lugar en el controlador, en la red de almacenamiento (SAN) o si está controlada por un dispositivo.

Los  puristas podrían sostener que la duplicación SAN y la duplicación basada en dispositivos no son duplicaciones basadas en matrices "reales" porque son independientes de la matriz de discos, pero en este artículo aceptaremos que la duplicación tiene lugar en el lugar de almacenamiento en vez de en el host o en la aplicación. Lo que distingue a la duplicación basada en el almacenamiento es que libera a los recursos de la aplicación y del servidor de la sobrecarga de procesamiento asociada con la duplicación.

Inconvenientes de la duplicación basada en matrices

Hace unos años era mucho más fácil esbozar los inconvenientes de la duplicación basada en matrices, ya que se trataba de una tecnología de bajo nivel que duplicaba bloques de datos sin mucha ceremonia. Muchas veces era necesario manipular las aplicaciones para mantener la integridad de los datos porque la aplicación no era consciente del proceso de duplicación. La tecnología ofrecía muy poco apoyo para el haDRware de almacenamiento heterogéneo, lo que lo hacía caro. Normalmente funcionaba en el controlador de la matriz y la duplicación remota era costosa debido a los requisitos de ancho de banda de la red y solía ser necesario algún tipo de protocolo de conversión de marca registrada. Las réplicas o RAID 1 son seguramente una de las formas más fáciles y mejor conocidas de duplicación basadas en el controlador (en matrices). También son conocidas por su costo y sus limitaciones.

No es que esos días estén muy lejos, pero las opciones de duplicación de datos son hoy en día mucho más flexibles y asequibles. Aunque una vez estuvieron reservadas para las organizaciones de alto nivel, hoy en día existen muchas ofertas disponibles para PYMES sin que cuesten demasiado. Esto ha hecho que la duplicación basada en matrices sea una opción muy popular porque está centralizada y es agnóstica desde el punto de vista del sistema operativo. Sin embargo, el reto todavía sigue siendo la interoperabilidad entre la mayoría de soluciones de los distribuciones.

Dicho esto, si lo que necesitamos en una solución de duplicación con un costo muy bajo para una cantidad de datos limitada, la duplicación basada en matrices todavía es demasiado cara para pequeños entornos o pequeñas oficinas remotas.

Cómo empezar con la duplicación de datos basada en matrices de discos

La mejor forma de empezar con la duplicación basada en matrices es responder primero a unas cuantas preguntas de alto nivel:

-Qué está intentando conseguir? La necesidad de implementar la duplicación basada en matrices puede ser para tratar copias de seguridad lentas, aumentar la frecuencia de las copias de seguridad, capturar datos que cambian de forma frecuente, reducir o eliminar la gestión de cintas, etc. Si la duplicación basada en el host o en la aplicación requiere demasiados recursos, la duplicación basada en las matrices es seguramente la propuesta correcta. Si se duplican grandes volúmenes de datos, la duplicación basada en el host o en la aplicación también puede interferir con el tráfico de red.

-Qué tiene que duplicar? La respuesta a esa pregunta puede influir de veDRad en el costo de la solución, así que siempre es bueno responderla de forma realista. Ya que en la mayoría de los casos la tecnología se utiliza para soportar al negocio, deberían considerarse requerimientos de negocio en los beneficios de la replicación en lugar de "es bueno tenerlo".

Esto nos lleva de nuevo a una discusión ya familiar sobre la disponibilidad de los datos, los objetivos del tiempo de recuperación (RTOs) y los objetivos del punto de recuperación (RPOs), que al final motivan la necesidad de una tecnología en concreto. Podría ser necesario que una aplicación determinada tenga acceso a la copia de datos más actualizada posible. En casos así, una tecnología como RecoverPoint de EMC Corp es una buena opción. La E/S se divide en la red SAN y se escribe de forma simultánea en dos matrices de almacenamiento admitidas y distintas, ya sean locales o remotas. Esto se hace de forma transparente y proporciona lo se conoce como protección de datos continua (CDP).

Por otro lado, la posibilidad de acceder a copias en un determinado momento podría ser conveniente. La corrupción de los datos o la eliminación de datos de forma no intencionada suelen citarse como situaciones en las que es necesaria esta funcionalidad. La tecnología de las Snapshots es una buena opción para crear múltiples copias en un instante sin que sea necesario una cantidad de espacio de disco que multiplique el espacio que ocupan los datos originales sólo por duplicar los bloques que se han cambiado. El conjunto de software NetApp Snap ofrece un grupo completo de opciones entre las que se incluyen Snapshots locales y remotas, réplicas, almacenamiento seguro y Snapshots específicas de la aplicación.

Duplicación que tiene más en cuenta a la aplicación

Una duplicación que tiene más en cuenta a la aplicación es seguramente el desarrollo más significativo en el campo de la duplicación basada en matrices. La integración de la duplicación en las aplicaciones ha hecho que sea posible crear copias de datos a la vez que la aplicación está en funcionamiento y se mantiene el acceso del usuario. Aunque la solución mejore las copias instantáneas, las réplicas o la duplicación basada en el volumen, la posibilidad de crear una réplica de un conjunto de datos en particular sin afectar el acceso del usuario a la aplicación está muy unido hoy en día a los requisitos de disponibilidad. Esta posibilidad es también muy superior a la copia de seguridad diaria tradicional, ya que puede admitir objetivos de punto de recuperación más estrictos, permitiendo múltiples copias diarias o incluso una protección continua.

Duplicación local y remota

Una función más significativa de la duplicación basada en matrices es la posibilidad de comprobar las copias de datos locales o remotas. Aunque esta capacidad seguramente no es única de la duplicación basada en las matrices, no es tan intrusiva ni requiere tantos recursos como la duplicación basada en el host o en la aplicación que, una vez más, proporciona la oportunidad de duplicar de forma más frecuente.

Opciones de los distribuidores para la duplicación basada en matrices

Existen muchos distribuidores con ofertas de duplicación basadas en matrices y el costo de estas ofertas puede variar. Entre los distribuidores más conocidos están:

-TimeFinder, SDRF, MirrorView, SAN Copy, SnapView de EMC

-El conjunto Advanced Copy Services de IMB Corp.

-Universal Replicator, TrueCopy y ShadowImage de Hitachi Data Systems

-El conjunto de software StorageWorks de Hewlett-PackaDR (HP)

Algunos distribuidores con ofertas especializadas tienen cuotas de mercado más pequeñas pero sin embargo ofrecen tecnologías de protección de datos innovadoras con un componente de duplicación basado en matrices como Data Domain, que mejora la reducción de datos mediante la deduplicación de datos como objetivo de un almacenamiento mejorado con la duplicación basada en matrices con propósitos de recuperación ante desastres.

Dicho esto, a excepción de SAN Copy de EMC, que duplica en LUN, y HDS con Universal Replicator que mejora TagmaStore, el soporte heterogéneo sigue siendo el principal reto para la duplicación basada en matrices.

La línea entre la duplicación basada en el host y la basada en la aplicación y la duplicación basada en matrices no está tan clara como lo estuvo en otro momento. La aparición de dispositivos de virtualización son la respuesta a la interoperabilidad entre plataformas heterogéneas a la vez que permanecen fuera del host.

Pierre Dorion es el director del centro de datos y consultor senior de Long View Systems Inc., en Phoenix (Arizona), que se especializa en las áreas de continuidad del negocio y servicios de planificación de recuperación ante desastres, y protección de datos corporativos.

Profundice más

Inicie la conversación

Envíenme notificaciones cuando otros miembros comenten sobre este artículo.

Por favor cree un Nombre de usuario para poder comentar.

- ANUNCIOS POR GOOGLE

Close