Fotolia

Evaluar Conozca los pros y contras de las tecnologías, productos y proyectos que está considerando.

Monitoreo, principio básico para la disponibilidad de un centro de datos

El monitoreo puede ser fundamental para lograr la continuidad operativa de su centro de datos, ya que le permite prevenir fallas y mejorar las operaciones.

Hoy en día, la continuidad operativa de cualquier negocio es fundamental. La evolución constante hace que los centros de datos se encuentren en incesante movimiento para lograr cumplir con los requisitos de una operación eficiente y sin interrupciones. La realidad absoluta del costo que representa la “caída” de los sistemas de información, en la mayoría de los casos, es desconocida, e incluso incalculable. Sin embargo, es común que existan fallas y desastres que se presentan en diversos momentos y, a menudo, cuando no hay gente operativa en el sitio.

De acuerdo con estadísticas del Instituto Ponemon, la mayoría de las “caídas” de los centros de datos son ocasionadas por las siguientes razones: fallas en UPS, hackers, errores humanos, problemas en el aire acondicionado y sistemas climáticos, fallas en la planta de emergencia y fallas en los equipos de TI. Lo anterior muestra que la infraestructura es el principal punto débil, al igual que la parte humana –por desconocimiento, falta de capacitación, falta de tiempo o falta de herramientas adecuadas–, lo cual genera incertidumbre en la continuidad de un negocio. En muchos casos, el desconocimiento de los costos totales que representa la falta de continuidad lleva a invertir en nueva infraestructura, e impide invertir en estrategias y soluciones de prevención.

En los próximos dos a tres años, de acuerdo con diversas encuestas, la principal inversión que se realizará en los centros de datos será en herramientas de gestión de infraestructura del centro de datos (DCIM), para  mejorar la parte de gestión y eficiencia, optimizar los recursos físicos, disminuir los impactos en los procesos del negocio y mantener los estándares de los acuerdos de nivel de servicio (SLA). La elección correcta de una solución de este tipo y su implementación pueden ser un proceso tortuoso e inoperante. Este tipo de soluciones, que son complejas, requieren mantenerse actualizadas con un grupo de gente que las opera bajo ciertos lineamientos, y quienes deben estar permanentemente capacitados.

A falta de DCIM, una herramienta de monitoreo

Semejante a los ERP hace más de una década, los DCIM tendrán un “boom” en los próximos años, y su costo y tiempo de implementación será elevado. No todas las empresas podrán contar con un DCIM en el corto o mediano plazo, pero es necesario para la continuidad operativa. Una investigación de mercado, desarrollada a principios de 2016 por la empresa de monitoreo ambiental y eléctrico de centros de datos, TKmE, encontró que más del 67% de las empresas encuestadas no son proactivas ante eventualidades de TI, más del 70% han tenido alguna falla y no cuentan con monitoreo de infraestructura, o no saben utilizarlo.

Una opción para las organizaciones es el uso de soluciones menos complejas y de costo accesible que resuelven gran parte de la problemática: monitorear, contar con información valiosa para tomar mejores decisiones de planificación, y aplicar la proactividad en el día a día. Recordemos que, para mejorar, es necesario medir.

Es importante “vender” la herramienta de monitoreo internamente. La pregunta básica será el retorno de la inversión (ROI), por lo que, mientras más se conozca la afectación económica y operativa que genera, y los beneficios que proporciona la herramienta de monitoreo elegida, será mucho más sencillo obtener los recursos para adquirirla. Adicionalmente, es muy útil si la herramientas incorpora reportes y análisis de información.

Entre las consideraciones generales mínimas que se debe medir están la temperatura (salida de aire, retorno de aire, servidores, equipos críticos), la humedad (el “cáncer de los equipos”), el derrame de líquidos, la apertura de puertas, la corriente y voltaje (CFE, entrada y salida de UPS, planta de emergencia, PDU) y la planta de emergencia (nivel de diesel). Todo esto debe poder verse en una sola pantalla, y se debe emitir alertas y notificaciones si algún umbral se sale de su parámetro establecido. En un futuro, empresas terceras proporcionarán este servicio de gestión.

Monitoreo y procedimientos, dupla ganadora

Al seleccionar este tipo de herramienta, se debe evaluar que brinde visibilidad sobre el estado del centro de datos; que minimice la interrupción del servicio; que disminuya el tiempo de identificación de fallas; que opere 24x7 en línea; que reduzca el costo de operación del centro de datos; que vigile el consumo y estado de la parte energética; que sea escalable; y que proporcione información oportuna (gráficas y tendencias) para la toma de decisiones administrativas y operativas. Por supuesto, ninguna herramienta es suficiente si no se cuenta con los debidos procedimientos internos para resolver las situaciones que se presentan con la información obtenida.

El monitoreo de la infraestructura es una realidad que hay que adoptar para ser eficientes y  proactivos, sin importar el tamaño del centro de datos, ni el tamaño de la organización. La prevención se debe adoptar como una cultura dentro de cualquier organización, y en todas y cada una de sus áreas y niveles. Las empresas seguirán invirtiendo en este mundo vertiginoso de la tecnología, pero les conviene considerar el monitoreo como parte fundamental de su inversión.  

Sobre el autor: Ernesto Cuéllar B. es CEO de TkmE.

Este artículo se actualizó por última vez en agosto 2016

Profundice más

Inicie la conversación

Envíenme notificaciones cuando otros miembros comenten sobre este artículo.

Por favor cree un Nombre de usuario para poder comentar.

- ANUNCIOS POR GOOGLE

Close