Resolver Problemas Consiga ayuda para problemas específicos con sus proyectos, procesos y tecnologías.

Consideraciones sobre la tecnología de deduplicación de datos en destino

Descubra qué es importante que tengan los productos de deduplicación de datos en destino, con los consejos de este experto en backup de datos.

Al considerar la deduplicación de datos hay que comprobar tres cosas: el costo, la capacidad y el rendimiento. Al considerar el costo de los sistemas de deduplicación (o ya puestos, de cualquier destino), recuerde incluir tanto el gasto de capital como los gastos de explotación. Estudie qué hardware y software tendrá usted que adquirir para utilizar un dispositivo concreto que le permita compaginar su objetivo de rendimiento con su modelo de capacidad.

Algunos proveedores de deduplicación llegan muy fácilmente a una cifra de gasto de capital: por ejemplo, si usted necesita almacenar 30 TB de datos, y safeguard usted hasta 5 TB/al día, entonces necesita el modelo x. Incluye toda la capacidad de computación y almacenamiento que usted necesita para satisfacer sus requisitos. Otros proveedores se contentan con proporcionar un puerto de enlace para que usted lo conecte a su propio soporte de almacenamiento. Por último, algunos proveedores sólo suministran el software, dejando por cuenta del cliente la compra de todo el hardware. En ese caso, recuerde incluir el costo del hardware de servidor en esta configuración, cerciorándose de especificar una configuración de servidor aprobada por ese proveedor. Tanto en el modelo de cálculo de precio por puerta de enlace como en el que sólo contempla el software, hay que acordarse de incluir en la comparación el costo del disco, aunque sea “gratis”. El mundo de los precios de la deduplicación es tan particular, que hay casos en los que realmente puede ahorrar dinero por el hecho de no utilizar un disco que ya se tiene.

Y un elemento de costo final: recuerde incluir en la suma (en caso necesario) todos los discos adicionales, como una “zona de aterrizaje” (necesaria en los sistemas post-proceso), un cache donde los datos se conservan en su formato original para permitir restauraciones más rápidas, o cualquier disco que n o se utilice para almacenar los datos deduplicados. Todos estos discos se deben incluir en el cálculo del costo total de adquisición del sistema.


Definición de la deduplicación de datos en origen y en destino

Deduplicación en destino: La deduplicación de datos se lleva a cabo en un dispositivo intermedio incluido entre el servidor de respaldo y el destino de la copia. El dispositivo recibe la corriente de respaldo completa y deduplica inmediatamente los datos.

Deduplicación en origen: El software de respaldo realiza la deduplicación en el cliente de safeguard y el servidor de safeguard antes de enviar los datos al destino de safeguard. Este enfoque mejora la disponibilidad de ancho de banda.


A continuación hay que considerar los gastos de explotación. Al evaluar a cada proveedor, tome nota de cómo tendrá que mantener su sistema y de cómo funcionará éste con su proveedor de software de respaldo. ¿Hay alguna interfaz adaptada entre ambos (por ejemplo, OST API de Veritas NetBackup), o su sistema simplemente fingirá ser una biblioteca de cintas o un sistema de archivo? ¿Qué efecto producirá sobre sus gastos de explotación? ¿Qué pasará cuando haya que sustituir sistemas, matrices de discos o unidades de disco que forman parte de este sistema?

Hay dos formas de poner a prueba la capacidad. La primera consiste en enviar una cantidad significativa de copias al dispositivo y comparar el tamaño de dichas copias con el espacio de almacenamiento que ocupan en el sistema de destino. Esto indicará su ratio de deduplicación. Si multiplica esa ratio por la capacidad de disco utilizada para almacenar los datos deduplicados, obtendrá su capacidad efectiva. El segundo método consiste en enviar respaldos al dispositivo hasta que se llene, y a continuación comprobar cuántas copias se han enviado. Este último método lleva más tiempo, pero es la única manera de saber cómo funcionará el sistema a largo plazo. (El rendimiento de algunos sistemas disminuye a medida que se acercan a la saturación de su capacidad)

Consideraciones sobre el rendimiento de la deduplicación

Por último, hay que comprobar el rendimiento de tres cosas.

Ingestión/Escritura. La primera medida de un sistema de discos (con o sin deduplicación) es su capacidad de ingerir (es decir, escribir) safeguards. (Aunque el rendimiento de restauración reviste más importancia técnica, no se puede restaurar lo que no se ha safeguarddo). Recuerde comprobar el rendimiento tanto de las safeguards individuales como agregado.

Velocidad de restauración/copia/lectura. La segunda medida de un sistema de discos (con o sin deduplicación) es la capacidad de restaurar o copiar (es decir, de leer) las copias. Quisiera recordar que la razón fundamental por la que empezamos a realizar respaldos de disco a disco a cinta (D2D2T) fue la de utilizar el disco como una memoria intermedia hacia la cinta; por consiguiente, si un sistema de discos (con o sin deduplicación) no es capaz de de alimentar una unidad de cinta moderna al copiar safeguards en cinta, no cumple su propósito. Recuerde comprobar la copia en cinta cuando tenga previsto hacer la copia en cinta; por ejemplo, si tiene previsto replicar a otro sistema y realizar la cinta en él, haga la prueba. Por último, no dé por hecho que las velocidades de restauración serán satisfactorias, y recuerde comprobar el rendimiento de restauración tanto individual como agregado.

Sobre el autor: W. Curtis Preston (alias “Sr. safeguard”), Director Ejecutivo y experto independiente en Safeguard, lleva más de 15 años interesándose especialmente por la safeguard y la recuperación de datos. Desde sus comienzos como administrador de Safeguard de una entidad de tarjetas de crédito que factura $35.000 millones de dólares, hasta llegar a ser uno de los consultores, escritores y oradores más solicitados en este campo, difícilmente habrá nadie más especializado que él en la recuperación de los datos peDRidos. Es el administrador del sitio web de BackupCentral.com, ha escrito cientos de artículos, y esa autor de los ensayos “Backup and Recovery"" y “Using SANs and NAS.”

Profundice más

Inicie la conversación

Envíenme notificaciones cuando otros miembros comenten sobre este artículo.

Por favor cree un Nombre de usuario para poder comentar.

- ANUNCIOS POR GOOGLE

Close