El sí y el no en deduplicación: las mejores prácticas de la tecnología de deduplicación de datos

Consejo

El sí y el no en deduplicación: las mejores prácticas de la tecnología de deduplicación de datos

La deduplicación de datos puede reducir significativamente el espacio de disco necesario para almacenar sus backups de datos, pero algunas de las cosas que se hacen en su centro de datos en realidad pueden actuar en contra de la deduplicación. Hay otras cosas que, sin ser necesariamente negativas para su sistema de deduplicación, de todos modos no son buena idea.

Este artículo explica qué hay que hacer (y qué no hay que hacer) si se va a realizar la deduplicación de datos.

Deduplicación de destinos

Este primer apartado sólo se aplica a los sistemas de deduplicación de destinos. Estos abarcan tanto los dispositivos de deduplicación como la deduplicación lógica de destinos incluida en su software de backup (por ejemplo, CommVault Simpana y Symantec Corp. Opción NetBackup PureDisk Media Server).

No lleve a cabo más copias completas sólo para mejorar la ratio de deduplicación. A algunos clientes, sus ingenieros de ventas de deduplicación de destinos les han dicho que realicen backups completos por la noche para mejorar sus ratios de deduplicación. Por favor no lo haga. Haga respaldos completos más frecuentes porque con ello mejora sus restauraciones, o porque le da tranquilidad a su administrador de bases de datos (los administradores de bases de datos siempre tienen un problema de confianza que se traduce en un incremento de las copias). Pero no lo haga sólo para mejorar la ratio de deduplicación.

Plantéese prolongar el periodo de conservación de sus backups en disco. Una vez que tenga su primera serie de copias en disco, requiere menos espacio añadir nuevas copias al mismo sistema de deduplicación que enviarlas a una cinta. Por lo tanto, si ya está usted almacenando 30 días en disco y 60 días en cinta, considere la opción de conservar los 90 días en disco. Le sorprenderá el escaso espacio de disco adicional que ocupa el respaldo, suponiendo que consiga usted una buena ratio de deduplicación.

No utilice el multiplexado para respaldar una biblioteca de cintas virtuales (VTL). Algunas personas realizan esta práctica de cinta física a cinta virtual, lo cual puede tener efectos devastadores en la ratio de deduplicación. Incluso los sistemas que pueden desmultiplexar los datos (FalconStor, Sepaton) recomiendan desactivarlo, pues sólo malgastan ciclos informáticos desmultiplexando los datos – ciclos que, de lo contrario, se podrían utilizar para que la deduplicación de datos fuera más rápida. En lugar de demultiplexar 40 backups en 10 unidades de cinta virtuales, cree 40 unidades de cinta virtuales y apague el multiplexado.

Deduplicación de orígenes y destinos

No se obsesione con su ratio de deduplicación, y punto. Debe examinar atentamente esa cifra cuando compare varios productos. Cuando envíe los mismos datos a cada sistema, compruebe cuál proporciona la mejor tasa de de deduplicación. Pero una vez instalado el sistema, procure no analizar en exceso este valor, sobre todo cuando está recién instalado. Al principio las velocidades de deduplicación siempre son reducidas, y van aumentando con el tiempo. Debe comprobar periódicamente que no se haya producido un cambio negativo importante en su ratio de deduplicación, pues podría ser una señal de que algo va mal.

Absténgase de encriptar los datos antes de que los vea el sistema de deduplicación. Por ejemplo, si respalda un sistema de archivos Windows Encrypted Filesystem en un sistema de deduplicación, no espere conseguir una ratio de deduplicación distinto de 1:1. Los sistemas de deduplicación buscan patrones, y los sistemas de cifrado eliminan los patrones –así que no deduplique.

No comprima los datos antes de que los vea el sistema de deduplicación –por dos motivos. El primero es que todos los sistemas de deduplicación comprimen después de deduplicar, de modo que usted no está adelantando nada al realizar la compresión. El segundo motivo es que la compresión puede “mezclar” los datos, y dificultar la búsqueda de patrones al sistema de deduplicación. (Nota: el sistema de deduplicación de CommVault permite encriptar y comprimir las backups una vez tomadas sus huellas digitales, y eso no incidirá en su ratio de deduplicación.)

Aprenda qué datos no se deduplican bien y plantéese no deduplicarlos. En la mayor parte de los sistemas de deduplicación, los datos creados por un ser humano (por ejemplo, documentos de Office, anotaciones en bases de datos) se deduplican bien. En cambio, los datos generados automáticamente por un equipo de cómputo no se deduplican bien. Las fotos, vídeos, archivos audio, las imágenes, los datos sísmicos son todos ellos ejemplos de datos que no se deduplican muy bien. Considere conservarlos en un sistema de almacenamiento sin deduplicación (algunos sistemas de deduplicación pueden desactivar la deduplicación de determinados conjuntos de datos).

Lea documentación sobre buenas prácticas referentes a sus sistemas de deduplicación concretos, y siga sus sugerencias. Las sugerencias contenidas en el presente artículo serán aplicables a la mayor parte o incluso a todos los sistemas de deduplicación, pero su producto específico puede tener algunas peculiaridades que convenga tener presentes a la hora de utilizarlas.

Pruebe varios sistemas de deduplicación antes de comprar uno. Hay algunos productos realmente buenos, pero también hay productos con algunas limitaciones reales. Sólo la comparación de varios productos permitirá detectar las deficiencias de algunos de ellos.

Pruebe a copiar datos desde su sistema de deduplicación a cinta si tiene previsto hacerlo. Es una de las prestaciones que diferencian a los niños de los adultos, por así decirlo.

No crea a un proveedor que le asegure que no existe ningún producto de deduplicación que no pueda volcar a su unidad de cinta a su velocidad máxima. Puede que la lista sea corta, pero existir existe. Desgraciadamente, algunos productos sólo pueden volcar a unidades de cinco o seis años de antigüedad.

Pruebe todo. No crea nada. Lea la documentación y siga sus consejos. Así estará a salvo en el terreno de la deduplicación.

Sobre el autor: W. Curtis Preston (alias “Sr. Backup”), Director Ejecutivo y experto independiente en Backup, lleva más de 15 años interesándose especialmente por la backup y la recuperación de datos. Desde sus comienzos como administrador de backup de una entidad de tarjetas de crédito que factura 35.000 millones de dólares, hasta llegar a ser uno de los consultores, escritores y oradores más solicitados en este campo, difícilmente habrá nadie más especializado que él en la recuperación de los datos peDRidos. Es el administrador del sitio web de BackupCentral.com, ha escrito cientos de artículos, y esa autor de los ensayos “Backup and Recovery"" y “Using SANs and NAS.”

Esto fue publicado por primera vez en septiembre 2009

Unirse a la conversación Comenta

Compartir
Comentas

    Resultados

    Contribuye a la conversacion

    Todos los campos son obligatorios. Los comentarios aparecerán en la parte inferior del artículo

    Aviso Legal: Nuestro Intercambio de Consejos es un foro para compartir asesoramiento técnico y conocimientos con sus compañeros y aprender de otros profesionales de TI . TechTarget proporciona la infraestructura para facilitar este intercambio de información. Sin embargo, no podemos garantizar la exactitud o validez del material presentado. Usted acepta que el uso del servicio de Preguntale al Experto su dependencia en las preguntas, respuestas, información u otros materiales recibidos a través de este sitio web está bajo su propio riesgo.