tashatuvango - Fotolia

Gestionar Aprenda a aplicar las mejores prácticas y optimizar sus operaciones.

Use un sistema de gestión de incidentes de TI para permitir la automatización

Los administradores y gurús de TI no pueden abordar todos los problemas cada hora del día, y mucho menos predecirlos primero. Una combinación dinámica de monitoreo y administración de incidentes hace mejores administradores.

Ningún entorno de TI es perfecto. Los problemas pueden ir desde simples cuestiones, como un servidor con poca capacidad de disco que hace que una aplicación deje de responder, hasta problemas intermitentes más complejos, como un sistema financiero que funciona mal al final de cada mes, cuando el departamento de contabilidad imprime todo un año de facturas.

Un administrador de operaciones de TI podría no ser capaz de predecir todos los problemas, pero un sistema de gestión de incidentes de TI automatizado podría tampoco hacerlo.

Los sistemas y las operaciones son difíciles de cuidar. Son difíciles de implementar, administrar y solucionar. Los entornos cambian constantemente, y los administradores de operaciones deben configurar la supervisión y la administración de cambios para las siete capas de la interconexión de los sistemas abiertos; ocho, si incluye usuarios. Cada entorno es único y, a su vez, imperfecto.

¿Dónde se traza la línea entre emplear a gurús de TI que mantienen y arreglan el entorno de forma manual e invertir en sistemas automatizados de gestión de incidentes de TI que informan o incluso solucionan problemas? La automatización y el conocimiento interno de TI deben coexistir para tener la mejor oportunidad en un entorno altamente operativo.

Dónde colocar la línea entre estos dos es un problema en la que cada empresa debe trabajar individualmente. Para obtener los mejores resultados, haga que el personal de TI experto confíe en los sistemas que muestran la salud ambiental, en lugar de actuar como un eterno personal de reparación de emergencias. Los seres humanos son falibles, y es poco probable que tenga varios miembros del personal con el mismo conocimiento en todos los sistemas dentro de la empresa.

Opciones de manejo de incidentes

Un sistema de gestión de incidentes de TI adecuadamente configurado utiliza herramientas de monitoreo para detectar un problema antes que un ser humano. Por ejemplo, si el enlace WAN de un sitio remoto falla, puede pasar desapercibido hasta que el usuario final se queje. Sin embargo, una herramienta de monitoreo que rastrea la disponibilidad de cualquier dispositivo en el otro extremo del enlace WAN –o incluso una dirección IP del enrutador que proporciona el enlace WAN– encontrará una anomalía rápidamente. El equipo de TI puede usar la configuración de monitoreo para desencadenar un evento, como enviar una alerta por correo electrónico a todo el equipo de TI. Los expertos en TI determinan la causa y comunican el problema a los usuarios. Recibir una alerta de un sistema automatizado de gestión de incidentes de TI y luego actuar en consecuencia requiere menos conocimiento técnico y del entorno del equipo de soporte de primera línea que solucionar un problema planteado por un usuario, especialmente cuando la comprensión del problema por parte del usuario no es clara .

Los sistemas de gestión de incidentes de TI son cada vez más flexibles y potentes. Por ejemplo, Operations Management Suite de Microsoft Azure utiliza funciones básicas, como el registro centralizado, junto con funciones avanzadas, como Service Map, que automáticamente descubre y construye un mapa de referencia de dependencia de servidores, procesos y servicios de terceros.

Los sistemas de gestión de incidentes TI que incorporan herramientas como Service Map, mapeo de dependencia de aplicaciones y otras funciones transfieren el esfuerzo y el trabajo necesarios para solucionar problemas fuera de las manos del experto interno de TI, que debe recordar cada servidor por dirección IP, nombre y capacidad de disco. En lugar de eso, un administrador de operaciones puede seguir las instrucciones estándar para configurar la gestión del monitoreo y de incidentes y visualizar cómo interactúan servidores y servicios específicos. Si este trabajo se realiza en el momento de la construcción del sistema, los sistemas complejos pueden documentarse por sí mismos para registrar y mostrar la conectividad y los requisitos de todas las partes móviles. El resultado es que, cuando algo se rompe, usted puede ver rápidamente dentro del sistema y descubrir fácilmente el punto de falla.

Opciones avanzadas

Algunas grandes empresas ponen gran énfasis en la automatización, incluso para sus sistemas de gestión de incidentes de TI. "Automatizar todas las cosas" es una frase popular de TI, pero la automatización completa puede tener poco sentido para la administración de recursos, dependiendo de cuáles sean las tareas. La respuesta avanzada de incidentes de TI automatizada puede conducir a una infraestructura de autocuración, pero eso está más allá de la realidad para la mayoría de las organizaciones. La automatización debe comenzar con los procesos más básicos y acumularse para cualquier esperanza de un estado fluido y funcional, dejando la promesa de la automatización de extremo a extremo como un sueño en el éter.

Otra forma de abordar los incidentes de TI es crearlos usted mismo. Netflix desarrolló un programa de ingeniería de caos, Chaos Monkey, y herramientas hermanas llamadas colectivamente Simian Army, que prueban la capacidad de recuperación del sistema rompiendo a propósito los procesos o interrumpiendo los servicios. Las organizaciones más conservadoras pueden experimentar con la ingeniería del caos en pequeñas dosis o en entornos de etapas, en lugar de derribar los sistemas de producción.

En última instancia, los administradores de operaciones de TI existen para ayudar al resto del negocio a hacer su trabajo. Los sistemas de gestión de incidentes y de monitoreo de TI automatizados fáciles de desplegar y fáciles de modificar facilitan esta tarea. Las herramientas correctas marcarán la diferencia. Si el esfuerzo para establecer procesos de monitoreo y remediación parece demasiado engorroso, el mantenimiento solo lo será más cuando ocurran cambios futuros en el sistema; al ritmo actual del cambio en TI, ese será un trabajo continuo. Incluso con un exitoso sistema de gestión de incidentes de TI con automatización incorporada, los administradores aún necesitan comprender sus entornos. Combine ese conocimiento con la automatización, y ellos harán menos solución de problemas manual y se centrarán mejor en dónde buscar problemas.

Investigue más sobre Gestión del centro de datos

Inicie la conversación

Envíenme notificaciones cuando otros miembros comenten sobre este artículo.

Por favor cree un Nombre de usuario para poder comentar.

- ANUNCIOS POR GOOGLE

Close