Resolver Problemas Consiga ayuda para problemas específicos con sus proyectos, procesos y tecnologías.

Los nuevos planes de protección de datos afectan a los tiempos de reconstrucción de las RAID

La protección de datos no consiste sólo en proteger los discos, sino la información. Descubra las tecnologías que reducirán los tiempos de reconstrucción de las RAID sin dejar de ofrecer un buen nivel de protección de datos.

Recientemente, se ha hablado mucho se reducir los tiempos de reconstrucción de las unidades de disco de gran tamaño en los entornos corporativos de almacenamiento de datos. Ya hay disponible una tecnología de reconstrucción más rápida, pero son muchos los administradores de almacenamiento que no les prestan la suficiente atención a las RAID de haDRware y a los tiempos de reconstrucción de las unidades individuales. Quizá la mejor forma de reducir los tiempos de reconstrucción y seguir contando con una protección de datos fiable es empezar por no tener que realizar esa reconstrucción.

Los fabricantes de sistemas de almacenamiento están empezando a comprender que la protección de los datos no consiste en la protección de los discos, sino en proteger la información. Por eso, sus planes de protección de datos están empezando a evolucionar en consecuencia. Hay algunos enfoques novedosos en el mercado que pretenden solucionar los problemas causados por unidades lentas y de gran tamaño. Algunas tecnologías reducen el número total de reconstrucciones que lleva a cabo un sistema. Otras tecnologías han pasado a adoptar planes de protección de datos basados en la información, gracias a los cuales, en vez que realizar réplicas exactas del disco, llevan a cabo réplicas exactas de la información (archivos, bloques u objetos). Y algunas de ellas incluso hacen un poco de las dos cosas. Así que, ¿cómo afecta todo esto a los tiempos de reconstrucción? Si pensamos en reconstruir la información en vez de en reconstruir un solo disco, se puede utilizar la potencia de la arquitectura del sistema, aprovechando la oportunidad de paralelismo masivo que ofrecen las arquitecturas multidisco.

Actualmente, hay varias tecnologías en el mercado que reducen el número total de fallos en la unidad, y, por tanto, el número de reconstrucciones necesarias. En algunos casos, los fabricantes ponen las unidades que no responden fuera de línea para hacer un diagnóstico de posibles problemas y las vuelven a poner en funcionamiento en caso de no encontrar ninguno. Éste es un enfoque muy bueno, puesto que elimina la necesidad de llevar a cabo una reconstrucción completa. Cuando una unidad se pone fuera de línea, el sistema hace un registro de todos los datos que hubieran ido a esa unidad mientras se estaba intentando recuperar. Una vez recuperada, sólo es necesario reconstruir los datos del registro, no el disco entero.

Algunos fabricantes realizan el acceso sobre dos espacios que reduce el número total de reconstrucciones necesarias y acelera el tiempo de reconstrucción aprovechando las arquitecturas de almacenamiento grid (en rejilla). Uno de los espacios se pone en marcha cuando una unidad no responde inmediatamente a una solicitud de acceso. El sistema responde realizando una minirreconstrucción de la paridad de los datos solicitados y devolviendo los datos de reconstrucción a la vez que retira del servicio, temporalmente, a la unidad que no responde. Después, esta unidad se somete a un breve diagnóstico y se vuelve a poner en funcionamiento, eliminando, por tanto, la necesidad de llevar a cabo una reconstrucción. Cualquier dato que se haya escrito mientras la unidad estaba fuera de línea se habrá escrito en otro espacio disponible del sistema.

Esto también acelera las reconstrucciones al poner en funcionamiento la arquitectura grid de la unidad. La mayoría de arquitecturas basadas en grids tienen nodos de almacenamiento o de capacidad, y nodos de procesador de forma separada. Por lo general, todos los nodos de procesador pueden accede a todos los nodos de capacidad. Al escribirse los datos, éstos se dividen en varios fragmentos, que se distribuyen, a su vez, por todos los nodos de almacenamiento que haya en el sistema. Usando por defecto nueve fragmentos de datos y tres fragmentos de paridad (el número exacto de fragmentos de paridad puede configurarlo el usuario), cada uno de los 12 nodos de almacenamiento recibe un fragmento. Si hay cuatro nodos de almacenamiento (la configuración mínima), cada uno recibe tres fragmentos. Si se produce un fallo en la unidad, se reconstruyen sus datos, como sucedería en una RAID de haDRware convencional. Pero a diferencia de la RAID convencional, los datos no se reconstruyen en una sola unidad, sino que se redistribuyen entre los distintos nodos de almacenamiento aprovechando toda la capacidad de almacenamiento que haya disponible.  Si falla todo un nodo de almacenamiento, los datos de esas unidades se reconstruyen en los nodos de almacenamiento restantes. Hemos visto este tipo de tecnología implementada tanto para datos protegidos con paridad como para datos duplicados. Al proteger los datos en vez de las unidades de disco, y gracias a la potencia de la arquitectura grid, la reconstrucción se lleva cabo en sólo una fracción del tiempo que hubiera llevado en una unidad convencional. Esto es así porque lo que se está reconstruyendo es la información y no la estructura exacta de la unidad.

Otros fabricantes buscan aprovechar sus arquitecturas para acelerar los tiempos de reconstrucción y reducir el riesgo de que se pieDRan los datos en caso de que fallen varias unidades. Cuando se escribe un archivo, los datos y la paridad se distribuyen entre las unidades de disco disponibles en el clúster. Si una unidad falla, los datos necesarios para llevar a cabo una reconstrucción se reparten entre los distintos nodos del clúster, de forma que se aprovechan todas las unidades que lo conforman.

De hecho, cambiar la estrategia de protección de datos de un enfoque basado en haDRware a un enfoque basado en software ofrece aún más posibilidades. Con un plan de protección basado en haDRware, la elección suele estar entre proteger todos los datos o ninguno. Pero con un plan basado en la información se abre la puerta a la posibilidad de un sistema de protección de datos más detallado basado en directrices.

Al final, las distintas características del almacenamiento son necesarias para tipos de datos diferentes. Los planes basados en RAID de haDRware siguen siendo una buena solución para las unidades más rápidas de poca capacidad y, por eso, no se prevé que vayan a desaparecer en un futuro próximo. Pero no debería sorprendernos que, con el tiempo, los planes de protección de datos basados en información se hicieran más habituales en productos de almacenamiento de primera categoría, puesto que los fabricantes continúan simplificando la gestión y construyendo sistemas centrados en la información.

Hay muchos fabricantes que ofrecen planes de protección de datos basados en información o tecnologías que permiten una rápida reconstrucción. Aunque la situación económica es complicada, el número de fabricantes que ofrece soluciones tecnológicas que aceleran o reducen la necesidad de llevar a cabo reconstrucciones parece estar en aumento. Cuando esté considerando adquirir una tecnología que aproveche las unidades de disco de gran capacidad, recueDRe preguntarle a su proveedor qué medidas se han tomado para reducir el riesgo de péDRida de datos durante las reconstrucciones.

Información sobre el autor: Terri McClure es analista senior de Enterprise Strategy Group en MilfoDR (Massachusetts, EE. UU.).

Profundice más

Inicie la conversación

Envíenme notificaciones cuando otros miembros comenten sobre este artículo.

Por favor cree un Nombre de usuario para poder comentar.

- ANUNCIOS POR GOOGLE

Close