Evaluar Conozca los pros y contras de las tecnologías, productos y proyectos que está considerando.

Optimice la disponibilidad de su centro de datos

La disponibilidad y la eficiencia energética son los mayores retos para los centros de datos actuales. Le ofrecemos algunos consejos para mejorarlos.

Los centros de datos no son lo que solían ser. Además de volverse en entornos más complejos y dinámicos, sus operaciones son hoy más críticas que nunca para la empresa, lo cual requiere una mayor disponibilidad y seguridad.

Raphael García, director de ventas de Emerson para América Latina, explicó que los centros de datos (DC) tienen que hacer frente a las presiones externas que cambian el ambiente de negocios y a las presiones internas que vienen con la tecnología, enfrentando así retos en cuanto al aumento de la demanda, la necesidad de una densidad más alta, mayor eficiencia e iniciativas verdes, consolidación, virtualización y nube, cumplimiento de regulaciones y subcontratación de TI, todo manteniendo un presupuesto reducido.

El experto indicó que, en materia de instalaciones, los retos se encuentran en las áreas de administración de la infraestructura, control de la densidad de calor, disponibilidad, eficiencia energética y densidad de potencia. Sin embargo, los principales dolores de cabeza suelen estar centradas en la disponibilidad y la eficiencia energética, los cuales requieren un balance a través del monitoreo y la gestión de la infraestructura.

Fallas de disponibilidad en el DC

La importancia de la disponibilidad del DC resulta clara si se considera los resultados de un estudio realizado por el Instituto Ponemon en 2010, según el cual 65% de las empresas encuestadas consideraban que su modelo de negocio dependía del centro de datos para generar ganancias e impulsar el comercio y 58% afirmó que minimizar los costos del DC y ser eficientes en el uso de energía estaba entre sus prioridades más altas. Resulta esclarecedor que 95% experimentó una o más caídas del DC en los últimos 24 meses, aunque esta cifra bajó ligeramente a 91% en una actualización del estudio realizada en 2013.

En cuestión de costos, García comentó que el costo estimado de una caída no planificada del DC fue de poco más de 7,900 dólares por minuto, según el estudio de 2013. La duración promedio en una caída total fue de 119 minutos, en tanto las caídas parciales promediaron 56 minutos. “Lo que es más impresionante es que 52% de los encuestados creen que todas o la mayoría de las caídas pudieron prevenirse. Entonces, ¿por qué no hacerlo?”, indicó el ejecutivo.

¿Cuál es la causa principal de una caída del centro de datos? La falla en la batería de los UPS (55%), ya sea porque estaban defectuosas o eran insuficientes. Le siguen los errores humanos y/o mal uso del interruptor de apagado de emergencia (48%), la superación de la capacidad del UPS (46%) y los ataques cibernéticos (34%). Otras causas son fallas del equipo de TI, cuestiones relacionadas con agua, clima y calor, y fallas de la infraestructura del UPS o de los circuitos.

“Las baterías suelen ser el eslabón más débil en el suministro crítico de potencia, porque una sola celda dañada puede hacer que unas instalaciones se caigan. Todo depende del nivel de redundancia y capacidad de reserva que se tenga. Si su reserva de baterías no es redundante y experimenta un fallo en las baterías, esto podría reducir o eliminar su tiempo de respaldo”, dijo García. Él explicó que las baterías tienen una expectativa de vida limitada, que se ve afectada por la cantidad de veces que se descarga y recarga, así como por el nivel de temperatura externa.

El ejecutivo ofreció algunas buenas prácticas para prevenir las causas principales de fallos en la disponibilidad del centro de datos:

  • Fallos de las baterías: La mejor prevención es el mantenimiento preventivo, así como el establecimiento de contractos de servicio para inspecciones y pruebas. Las acciones deben ser mensuales, trimestrales y anuales.
  • Se excedió la capacidad del UPS: Se debe considerar núcleos adicionales del UPS para capacidad y redundancia, así como mantener la capacidad del UPS redundante en un 30% o 40%. Ya que la carga de TI no debe exceder la capacidad total de un solo UPS, se debe determinar el tamaño del sistema UPS con base en el crecimiento máximo a futuro, y se debe configurar de manera redundante en paralelo. Igualmente, es fundamental el monitoreo en tiempo real para administrar el balance de las cargas.
  • Apagado de emergencia (EPO) accidental/ Error humano: Van desde la documentación de cómo se opera el equipo crítico, la estandarización de procedimientos y la realización de entrenamientos de rutina, hasta el monitoreo remoto, la supervisión de visitantes y la limpieza del entorno del DC. Adicionalmente, se debe separar los buses A y B del EPO, tener el apagado de emergencia separado de la alarma contra incendios, eliminar el control local del UPS y las PDU, protegerlo físicamente y brindar características de prueba y mantenimiento para reducir las posibilidades de un apagado de emergencia accidental.
  • Fallo del equipo de UPS: Contar con un cronograma regular para el mantenimiento y reemplazo de los componentes de vida limitada del UPS, como capacitadores AC y DC.
  • Fallos relacionados con el calor y el agua: La recomendación es optimizar del flujo de aire a través de la gestión. El uso de confinamiento, sensores adicionales y técnicas de control avanzado pueden ayudar a aprovechar los recursos de enfriamiento.

Aumente la eficiencia energética mejorando el enfriamiento

De acuerdo al perfil de consumo de electricidad de los centros de datos, los equipos de TI consumen 52% de la energía, en tanto los de energía y enfriamiento consumen un 48%. En materia de enfriamiento, García sugirió que se puede realizar algunos ajustes para llegar a una mejor eficiencia energética, tales como:

  1. Maximizar la temperatura que entra a la unidad de aire acondicionado. Eso se logra con una separación controlada del flujo de aire frío y del caliente a través del enfriamiento del perímetro y el enfriamiento con base en filas; evaluando la temperatura meta de suministro; cambiando al control de la temperatura el aire de suministro de los racks; tener como meta RAT > 35°C (95°F).
  2. Mantener un flujo de aire y enfriamiento variable, con ventiladores y compresores de capacidad variable.Esto iguala las condiciones de carga parcial de TI en puntos de funcionamiento más eficientes para los compresores, ventiladores y cumple los cambios dinámicos; elimina el desperdicio de incluir capacidad en exceso; respalda la acción anterior pues controla la temperatura del aire de retorno; logra beneficios de hasta un 25% con respecto a las soluciones de capacidad fija.
  3. Adaptar la capacidad de enfriamiento y el flujo de aire con el equipo de TI. Se debe eliminar el flujo de aire excesivo (y la energía de los ventiladores) al desacoplar los kW de enfriamiento del flujo de aire para adaptarse al funcionamiento dinámico de los servidores. Esto ofrece un beneficio de eficiencia del 10% al 15%.
  4. Maximizar las horas de enfriamiento gratis. Para conseguir esto, se debe entender los requerimientos de los servidores con respecto a las temperaturas de suministro y el uso del aire del exterior; luego, se debe evaluar las tecnologías para climas específicos y entender los beneficios para el costo total de propiedad; finalmente, hay que considerar las tecnologías adecuadas para ello, tales como chillers condensados con aire o con agua, economizadores de agua DX - Glycool; aire del exterior; refrigerante bombeado y de evaporación.
  5. Considerar la nueva tecnología de transferencia de calor. 

“No debemos perder de vista que nuestro enfoque, como responsables de los centros de datos, debe estar en la disponibilidad y eficiencia. El objetivo es alcanzar una protección y una eficiencia máximas”, concluyó.

Profundice más

Únase a la conversación

1 comentario

Envíenme notificaciones cuando otros miembros comenten sobre este artículo.

Por favor cree un Nombre de usuario para poder comentar.

En las causas principales de fallo, ¿todos los tantos por cien no deberían sumar 100? Estoy leyendo un artículo cuyas cifras no entiendo. Por favor una explicación ...
Cancelar

- ANUNCIOS POR GOOGLE

Close