Alex_Mac - Fotolia

Noticias Manténgase informado sobre las más recientes actualizaciones de productos y noticias de tecnología empresarial.

Apagón de Delta, una llamada de alerta para los ejecutivos de TI y los CEO

El apagón de Delta no es el primer desastre relacionado con DR que golpea a una organización bien conocida, y no será el último.

Los problemas de Delta comenzaron con un pequeño fuego y un corte de luz. El fuego fue extinguido rápidamente, pero, para entonces, ya había provocado una reacción en cadena que llevó a más de 2,000 vuelos cancelados, millones de dólares perdidos, una mala reputación y un montón de preguntas para los profesionales de TI.

Durante el apagón de Delta, alrededor de 300 de los 7,000 servidores de la compañía aérea no estuvieron conectados con el sistema de energía de reserva, una vulnerabilidad de la cual la empresa no había sido consciente, a pesar de haber invertido "cientos de millones de dólares en actualizaciones y sistemas de infraestructura de tecnología, incluyendo los sistemas de respaldo”, dijo el CEO de Delta, Ed Bastian en un mensaje de video.

"No está claro que las prioridades en nuestra inversión hayan estado en el lugar correcto", agregó Bastian. "Ha causado que hagamos un montón de preguntas, para las que francamente no tenemos un montón de respuestas".

Si usted es un civil  de TI como yo (que no volaba Delta esta semana), la admisión franca del CEO despierta la compasión; excepto que no debería.

"No tener los servidores conectados a la energía de reserva, eso es TI 101", dijo el experto en DR, Michael Herrera, CEO de MHA Consulting, una empresa de consultoría en continuidad de negocio en Glendale, Arizona. "Cuando se hace un apagado completo de su centro de datos y se va hacia el poder de respaldo para asegurarse de que puede manejar la carga, esto es algo que se encuentra de forma inmediata. En mi opinión, esto no debería haber sucedido en este nivel de una organización".

Marcos Jaggers, un analista de continuidad y recuperación del centro de datos de Gartner, también piensa que Delta podría haber dejado caer la pelota en las pruebas de configuración de fuentes de energía, pero ve la situación de la línea aérea como indicativo de un problema más grande que afecta a los departamentos de TI: una planificación y pruebas insuficientes de recuperación de desastres.

"Mucha gente hace pruebas alrededor de recuperación de desastres, moviendo una carga de trabajo entre diferentes sitios, pero una vez que han hecho eso, ¿vuelven atrás y buscan defectos en el diseño de los sistemas que están allí? No conozco muchas empresas que estén haciendo ese tipo de pruebas después del hecho, o como parte de una prueba de recuperación de desastres", dijo.

Efecto dominó

El apagón de Delta es un ejemplo perfecto del efecto dominó que resulta de la falta de pruebas de DR, dijo la analista de Forrester Research, Stephanie Balaouras.

"Los entornos de TI se han vuelto tan complejos, con intrincadas interdependencias, que interrupciones como esta se están convirtiendo en la norma, ya que lleva un fallo de un solo componente, o un error humano para causar una interrupción generalizada", dijo Balaouras.

Delta no es la única aerolínea que ha experimentado este efecto en cascada. El mes pasado, Southwest Airlines sufrió problemas informáticos que cancelaron cientos de vuelos y causaron grandes retrasos. Del mismo modo, el año pasado 5,000 aviones de United Airlines se vieron afectados por un fallo informático.

"Creo que estamos viendo esto mucho con las compañías aéreas ahora debido a la escala que una gran cantidad de líneas aéreas han alcanzado", dijo Jaggers. "Cada vez que tienen un fallo, puede afectar a mucha gente inmediatamente y luego, por la forma en que las compañías aéreas están estructuradas, el tiempo de recuperación del negocio lleva bastante tiempo. Se tiende a afectar más que solo las seis horas de tiempo de inactividad. En el caso de Delta,  está tomando cuatro días".

'Puede pasar'

¿Qué más pueden aprender los ejecutivos de TI del apagón de Delta? Todo vuelve a lo básico, dice Roberta Witty, analista de Gartner centrada en la gestión de la continuidad del negocio.

"Concéntrese en lo que es de misión crítica y asegúrese de que está en marcha y funcionando bien todo el camino, a través de una pérdida de un componente, una pérdida de energía, una pérdida de la red y una pérdida de datos, de modo que, al menos, usted tenga una base fuerte para los servicios de TI de misión crítica. Y luego pase hacia menos de misión crítica", dijo Witty.

"Usted quiere poner su inversión donde tiene más sentido para la compañía, y eso es todo a través de la evaluación de riesgos y el análisis de impacto en el negocio", dijo.

Por supuesto, eso es más fácil de decir que de hacer. Una gran cantidad de cambios ocurren en solo un año, por lo que uno puede imaginar los cambios por los cuales pasan las organizaciones en tres, cinco o siete años, dijo Witty, haciendo hincapié en el reto de mantener su entorno de recuperación de desastres actualizado.

Pero sí se requiere vigilancia, aunque consuma tiempo y sea costosa.

"Lo que las empresas tienen que hacer es continuamente racionalizar y modernizar sus entornos de TI, y mantener un mapeo de dependencias continuo", dijo Balaouras. Además, cada vez que hay un cambio en el entorno, todos los planes y políticas deben ser actualizados. Cada vez que hay un cambio sustancial, una prueba importante del plan de DR debería ser obligatoria.

"Es un área en la que casi todas las empresas son terribles", añadió.

El mejor lugar para tener este tipo de proceso de revisión, dijo Witty de Gartner, es en las primeras etapas del ciclo de vida de desarrollo de sistemas, porque los problemas pueden ser capturados antes de que el sistema haya sido incluso establecido. También puede ser mucho más caro hacer DR después de los hechos, añadió.

Pero, tal vez el cambio más fundamental que los ejecutivos de TI necesitan hacer en lo que respecta a la DR es su punto de vista. Cuando los expertos de DR como Herrera y su equipo realizan evaluaciones de amenazas y riesgos que despliegan las amenazas más importantes para las organizaciones, muchas veces los clientes no creen que ciertas situaciones de amenaza vayan a pasar alguna vez, yendo tan lejos como reírse de Herrera fuera de la habitación. Su apuesta:

"Creo que la gente en el mundo de hoy primero tiene que decir ‘puede suceder’”.

Resumen de noticias para los CIO

El apagón masivo de Delta no fue la única gran historia de la primera quincena de agosto. Otros sucesos importantes fueron:

- Casos de robo de datos en aumento. En una reciente encuesta de profesionales de TI realizada por el Instituto Ponemon, el 76% de los encuestados dijo que sus compañías experimentaron pérdida o robo de datos corporativos en los últimos dos años, en comparación con el 67% de los encuestados en 2014; 78% de los encuestados estaban preocupados por las amenazas de ransomware. Los datos no estructurados, como correos electrónicos y documentos, son algunos de los datos más preciados en la mayoría de las brechas. En cuanto a las razones detrás del aumento de robos de datos, el estudio cita a una pobre gobernanza, incluyendo "compromisos en las cuentas internas que se exacerban por un acceso mucho más amplio de empleados y terceros a la información sensible, de lo que es necesario", junto con la falta de monitoreo de las actividades de correo y de documentos de los empleados y de terceros, como los principales factores. El estudio, patrocinado por Varonis, encuestó a 3,027 profesionales en todo EE.UU. y Europa.

- Embolsándose startups de AI. El fabricante de chips Intel anunció el martes que estaba adquiriendo la startup de aprendizaje profundo basada en San Diego, Nervana Systems, por más de 400 millones de dólares. "Su IP y experiencia en la aceleración de algoritmos de aprendizaje profundo ampliará las capacidades de Intel en el campo de la IA", dijo en un comunicado Diane Bryant, vicepresidente ejecutiva y gerente general del grupo de centros de datos para Intel. La adquisición de Intel viene de la mano de la compra de Apple de la startup de inteligencia artificial y aprendizaje automático, Turi, por 200 millones de dólares. En otras noticias de adquisiciones, Hewlett Packard Enterprise está comprando SGI por 275 millones dólares, en un esfuerzo por ampliar las áreas de analítica de big data y computación de alto rendimiento.

Próximos pasos

Revise también:

La virtualización y la nube ayudan a DR en España

Guía esencial para que (por fin) elabore su plan de DR y BC

DR como servicio: un mercado PyME emergente para el canal

Disponibilidad continua de TI: Un paso adelante en la evolución de DR

Investigue más sobre Recuperación de desastres y continuidad del negocio

Inicie la conversación

Envíenme notificaciones cuando otros miembros comenten sobre este artículo.

Por favor cree un Nombre de usuario para poder comentar.

- ANUNCIOS POR GOOGLE

Close