BACKGROUND IMAGE: iSTOCK/GETTY IMAGES

Este contenido es parte de Guía Esencial: Protección de datos empresariales: Guía Esencial
Evaluar Conozca los pros y contras de las tecnologías, productos y proyectos que está considerando.

Durabilidad Vs. Protección y disponibilidad de los datos

Las garantías de durabilidad de datos no deberían ser una gran preocupación para el almacenamiento en la nube, aconseja un analista de IDC.

La durabilidad del almacenamiento de datos en la nube de algunos de los principales proveedores presumen de manejar un número impresionante de nueves –como el 99.999999999% de Amazon– pero las garantías no deberían ser motivo de preocupación, según un analista que investiga este mercado.

Dan Iacono, director de investigación en la práctica de sistemas de almacenamiento en International Data Corp. (IDC), con sede en Framingham, Mass., dijo que las garantías de durabilidad de los datos son difíciles de medir y hacer cumplir, por lo que los usuarios de almacenamiento en la nube harían mejor en cuestionar a los proveedores sobre las formas en el que se protegen los datos y la disponibilidad general de los servicios.

En esta entrevista con Carol Sliwa, colaboradora de TechTarget, Iacono proporciona una introducción a la durabilidad de los datos almacenados en la nube, incluyendo una definición, descripción de los tipos de protección de datos que usan los principales proveedores y un resumen de los casos de uso y la reducción de las opciones de durabilidad.

¿Qué es la durabilidad en el contexto de almacenamiento en la nube?

Dan Iacono: Creo que la durabilidad es un tema difícil de entender para la gente. La mayoría de la gente ni siquiera se da cuenta de que la durabilidad es un problema en su propio entorno, porque tal vez tenga terabytes e incluso petabytes en mi entorno, pero cuando se es un proveedor de la nube, se piensa en exabytes y zettabytes. A lo que realmente se refiere la durabilidad es a esos errores incorregibles de bits de los que no hay recuperación, de los medios de comunicación subyacentes. Después de haber escrito una gran cantidad de datos, uno de los bytes puede no ser correcto. Creo que una de las cosas más duras con los proveedores de la nube es que en realidad no todos ellos tienen garantías de durabilidad, por lo que todos lo definen de manera un poco diferente.

¿Qué tipos de arquitecturas y tecnologías de almacenamiento utilizan los grandes proveedores de nube para garantizar la protección contra la pérdida de datos?

Iacono: Lo único que buscan desde una perspectiva de pérdida de datos, en relación con la durabilidad, es el concepto de bit corrupto o deteriorado (bit rot). El deterioro de bits es una pequeña pieza de información o bits, que se echa a perder después de un período de tiempo. Hay dos maneras en que las personas se protegen contra el deterioro de bits. La primera es que periódicamente revisan todos los datos y los comparan con una copia conocida. Los proveedores de nube pueden hacer eso al tener varias copias de los datos. La segunda forma en que lo hacen es a través de una técnica conocida como código de borrado, donde tienen un algoritmo matemático que compara una copia completa de los datos frente a una versión más pequeña.

Usted mencionó dos formas de protección de datos. ¿Es alguna forma preferible a la otra en el contexto de almacenamiento en la nube?

Iacono: Hay un par de diferentes casos de uso. Si realiza varias copias, esta es la forma tradicional en que los proveedores de nube o prestadores a hiperescala han protegido los datos. El problema con múltiples copias de datos es que con el tiempo, mientras la capacidad crece exponencialmente, también lo hace la cantidad de copias. Así que realmente se convierte en una forma cara de proteger los datos.

El código de borrado es sin duda una forma más compacta. Así que, digamos, por cada pieza de información, sólo tengo tal vez entre un 20% y un 50% de los datos. Puedo reducir mi huella de almacenamiento general, sin embargo, se requieren ciclos de CPU para realmente reconstruir esos datos utilizando la codificación de borrado. Por lo tanto, hay algunas ventajas y desventajas. Creo que en el largo plazo, para algunos de los que manejan almacenamiento duradero reducido, la codificación de borrado será algo que definitivamente pueden utilizar, ya que necesitan ofrecer un precio agresivo. [Además,] la codificación de borrado es muy buena para los entornos que tienen tres o más sitios de replicación.

Esa es la perspectiva de un proveedor de la nube. ¿Y desde la perspectiva de un cliente? ¿Debería hacer una diferencia si un proveedor de almacenamiento en la nube utiliza la codificación de borrado o múltiples copias para proteger los datos?

Iacono: Yo creo que sí. Con la codificación de borrado, mi recuerdo real de los datos –si algo pasa– será más lento, mientras que si utilizo varias copias, la reconstrucción y la disponibilidad serán mucho más rápidas. Así, en primer lugar, uno dice: 'Hey, ¿cómo estás protegiendo los datos?’ En segundo lugar, me enfocaría en el costo. Y entonces yo realmente vería la combinación en su conjunto y la aplicaría a los casos de uso de mis datos.

Con los dos tipos de protección de datos, ¿cuáles de los principales proveedores de almacenamiento en la nube utilizan codificación de borrado y cuáles utilizan varias copias?

Iacono: Yo creo que hay que fijarse en quién realmente lo ha puesto públicamente a disposición. Cualquier persona que esté usando, digamos, una solución Atmos de EMC cuenta con el código de borrado incorporado, y esos serían AT&T y Savvis. Microsoft Azure utiliza codificación de borrado también. Si nos fijamos en la conferencia FAST 2012 [File and Storage Technologies], ganaron el reconocimiento al mejor documento por su codificación de borrado. Si nos fijamos en Google, son conocidos por hacer varias copias de los datos. Y Amazon y algunos de los otros proveedores de nube,  no sabemos exactamente qué tipo de protección que están usando para mayor durabilidad.

Los proveedores de almacenamiento en la nube como Amazon y Google ofrecen opciones para  niveles inferiores de durabilidad a costos reducidos en comparación con su principal objeto de servicios. ¿Para qué tipos de datos es adecuada la durabilidad reducida, y para qué tipo de datos no es lo adecuado?

Iacono: Yo creo que hay que entender dos partes de sus datos. Uno de ellos es ¿qué tipo de datos necesito para dirigir mi negocio? Y nos gustaría pensar que se trata de datos de misión crítica. La segunda es, ¿qué datos puedo reconstruir con bastante facilidad? En un entorno tradicional, tenemos datos de misión crítica, y los queremos disponibles todo el tiempo. Así que, yo realmente me preocuparía por la durabilidad y la disponibilidad. Ahora bien, voy a tener otras piezas de datos que se pueden corregir en el software, y si puedo reconstruir fácilmente esos datos y puedo guardarlos a un costo mucho menor, entonces sin duda tomaría ventaja del almacenamiento de durabilidad reducida para bajar la los costos generales de almacenamiento.

¿Cree que los clientes podrían utilizar almacenamiento en la nube de durabilidad reducida para todos sus datos?

Iacono: Realmente depende de lo que la aplicación de nivel superior puede hacer. Si nos fijamos en muchas de estas nuevas aplicaciones, o propiedades de escala Web, tienen un concepto en el que se diseña con las fallas en mente. Por lo tanto, ellos no creen que los datos o el hardware subyacente sean realmente fiables. Así planean su software. Por lo tanto, creo que las nuevas aplicaciones que se han diseñado con el fracaso en la mente sin duda pueden tomar ventaja de tener menor duración de almacenamiento para todos sus datos.

¿Qué tan importante es una garantía de durabilidad con un proveedor de almacenamiento en la nube?

Iacono: El problema de la garantía es que si pierdo un poco de información, ¿cómo sé que ese bit de datos se haya perdido debido a la durabilidad? ¿El proveedor de la nube realmente admitirá que había un problema de durabilidad? Así que a menos que podamos medirlo, yo realmente no me enfocaría demasiado en la durabilidad. Lo que me gustaría saber es cómo el proveedor de la nube protegerá mis datos. ¿Con varias copias o codificación de borrado? Eso es lo que me preocupa más en lugar de la garantía.

¿Cuál es el consejo más importante que ofrecería a los potenciales usuarios de almacenamiento en la nube con respecto a la durabilidad?

Iacono: Creo que es un punto importante a considerar, pero yo no basaría todo mi juicio en la durabilidad. Ya sea que ofrezcan 13 o 17 nueves, realmente no importa, realmente no influirá en mi decisión. Lo que realmente deben preguntar a su proveedor de almacenamiento en la nube es, "¿Cómo se protegen contra el deterioro de los bits?" Y entonces empezaría a preocuparme acerca de la disponibilidad general. Pero si tiene grandes cantidades de datos en la nube, entonces sí me preocuparía por la durabilidad.

Inicie la conversación

Envíenme notificaciones cuando otros miembros comenten sobre este artículo.

Por favor cree un Nombre de usuario para poder comentar.

- ANUNCIOS POR GOOGLE

Close