Sergey Nivens - Fotolia

Gestionar Aprenda a aplicar las mejores prácticas y optimizar sus operaciones.

El crecimiento de datos oscuros muestra la necesidad de una mejor clasificación

Los datos oscuros causan todo tipo de problemas, pero hay formas de mitigarlos. Sin embargo, los clientes continúan agregando almacenamiento como una solución de vendaje, porque es más barato y más simple.

Los datos oscuros no son solo un problema de gestión de datos. Causan problemas en el almacenamiento, las copias de seguridad, el cumplimiento y la seguridad, ya que la carga de datos no clasificados conlleva costos y responsabilidades adicionales.

Gartner, firma de consultoría e investigación de mercado, define los datos oscuros como "los activos de información que las organizaciones recolectan, procesan y almacenan durante las actividades comerciales normales, pero generalmente no se utilizan para otros fines".

Los expertos en TI han empujado el lado oscuro de la definición aún más, usando el término para referirse a datos mal definidos o no categorizados. En una entrevista publicada en nuestra publicaci´pn hermana SearchSecurity, el CTO de Splunk, Tim Tully, definió los datos oscuros como datos desconocidos, no identificados o no utilizados. En tanto, el proveedor de protección de datos empresariales Veritas se refiere de manera similar a los datos sin etiquetar o que no están clasificados.

Un estudio reciente encargado por Veritas y realizado por la firma de investigación de mercado con sede en el Reino Unido, Vanson Bourne, encontró que el 52% de los datos dentro de las organizaciones se consideran datos oscuros. El estudio encuestó a 1,500 tomadores de decisiones de TI en 15 países sobre sus desafíos de administración de datos. Otras conclusiones incluyen una pérdida anual promedio de $2 millones de dólares debido a una gestión ineficiente de los datos y una pérdida de productividad de dos horas por día dedicadas a la búsqueda de datos relevantes.

El estudio destacó que se trata de un problema de administración de datos, pero la naturaleza desconocida de los datos oscuros causa muchos problemas en múltiples áreas de TI. Por ejemplo, desde un punto de vista de seguridad, los datos oscuros podrían contener registros del servidor que detallan de dónde viene un ataque.

Jyothi Swaroop, vicepresidente de productos y soluciones en Veritas, con sede en Santa Clara, California, dijo que otra preocupación de seguridad es si un ataque de ransomware cifra los datos oscuros de una organización.

"Usted está más preocupado cuando no sabe lo que se toma", dijo Swaroop, y agregó que, si una organización sabe exactamente lo que perdió, es más fácil planearlo o restaurarlo.

Otros problemas se encuentran en el mantenimiento de datos oscuros. Una organización no puede saber si vale la pena mantener los datos oscuros, pero aun así pagan para almacenarlos y hacer una copia de seguridad de la misma manera que con los datos de misión crítica correctamente identificados. Desde el punto de vista del cumplimiento, los datos oscuros son una responsabilidad potencial, porque las organizaciones no pueden saber con certeza si han eliminado todas las copias de algo.

Según George Crump, fundador de la firma de análisis de la industria del almacenamiento Storage Switzerland, gracias a la proliferación de sensores de internet de las cosas, los dispositivos de borde, cámaras y otros dispositivos de captura, la capacidad de recopilar datos supera con creces la capacidad de categorizar y procesar.

"Estamos recopilando demasiados datos", dijo Crump. Añadió que la mayoría de estos datos son generados por sistemas y procesos, como los archivos de registro.

Crump sugirió varios enfoques para reducir o eliminar el cuello de botella. Una es direccionar potencia de cálculo en crudo al proceso de análisis y clasificación de datos. Otro es ser juicioso sobre la frecuencia con la que se capturan los datos. El objetivo es determinar lo más rápido posible si vale la pena mantener los datos ya que se ingieren, lo que detendría la acumulación de datos oscuros.

Para lidiar con un depósito existente de datos oscuros, las herramientas de análisis deberían implementarse para rastrear los datos y clasificarlos de manera retroactiva. Swaroop sugirió que la mejor manera de evitar los datos oscuros es mediante la construcción de un sistema de administración de datos integrado e inteligente que brinde visibilidad sobre los datos desde su creación hasta su retiro o eliminación.

Ignorando el problema

Crump dijo que, hace 20 años, la gestión de datos era una necesidad, porque las organizaciones no podían crear sistemas de almacenamiento que fueran lo suficientemente grandes como para contener cada pieza de datos recopilada. Desde entonces, la tecnología de almacenamiento mejoró y se volvió más barata.

"Literalmente, no se pudo construir un sistema de almacenamiento lo suficientemente grande, pero ahora podemos", dijo Crump. "En lugar de ser eficientes con nuestra administración, estamos dedicando más almacenamiento al problema. Podemos mantenerlo para siempre, pero nos falta la capacidad de analizar rápidamente los datos".

Esto también ha llevado a una mentalidad de nunca borrar nada, ya que cuesta tan poco mantenerlo para siempre. La compañía vinícola Palmaz Vineyard genera alrededor de 1 GB de datos de condiciones ambientales cada hora para ayudar a informar el proceso de fermentación de su vino impulsado por aprendizaje automático. El gerente general, Christian Gastón Palmaz, dijo que mantiene todos esos datos.

"Hay algo malo en eliminar algo por lo que trabajaste tan duro. Siempre hay una manera de almacenarlo", dijo Palmaz. "Una vez que se ha ido, se ha ido para siempre. Y, para mí, siempre debería existir".

Otro desafío radica en lograr que las organizaciones adopten tecnología de gestión de datos. A menudo, para los administradores de TI es difícil lograr que se incorporen sus altos mandos, dijo Christophe Bertrand, analista sénior de Enterprise Strategy Group, con sede en Milford, Massachusetts.

"Estas soluciones no producen suficiente ROI visible", dijo Bertrand, lo que las hace más difíciles de vender a los líderes empresariales. Reparar datos oscuros no es rentable en sí mismo, pero convertir los datos en algo útil, como usarlos para análisis o pruebas/desarrollo, puede ser la clave para cambiar de opinión.

Pero las organizaciones continuarán generando más almacenamiento en el problema de los datos oscuros, porque es la forma más simple de darle la vuelta al asunto, dijo Crump. Dijo que, en su experiencia en consultoría con empresas que tienen este problema, generalmente no conocían una mejor manera de resolverlo, ni tienen tiempo para investigar e implementar un servicio. Mientras la complejidad agregada no exceda las desventajas de comprar más almacenamiento, la práctica continuará.

"Si te estás ahogando, no tienes tiempo para aprender a nadar", dijo Crump.

Este artículo se actualizó por última vez en julio 2019

Profundice más

Inicie la conversación

Envíenme notificaciones cuando otros miembros comenten sobre este artículo.

Por favor cree un Nombre de usuario para poder comentar.

- ANUNCIOS POR GOOGLE

Close