Noticias Manténgase informado sobre las más recientes actualizaciones de productos y noticias de tecnología empresarial.

Los clusters NAS aumentan a medida que se extienden los datos no estructurados

A medida que aumenta la capacidad NAS para adaptarse a las necesidades cambiantes de la empresa, dominar los datos no estructurados se va convirtiendo en una gran prioridad para los administradores de almacenamiento.

Según la empresa de estudios de mercado IDC, el aumento de los datos no estructurados en los centros de datos tradicionales superará con mucho el incremento registrado por los datos de transacción de los últimos cuatro años.

La oleada de datos no estructurados ya ha llegado a algunas organizaciones. Para el año que viene, la empresa de biotecnología Complete Genomics tiene previsto lanzar un programa de secuenciación de genomas con un costo de unos 5.000 $ por genoma analizado. En el transcurso del desarrollo de esta aplicación, los datos no estructurados de su entorno han aumentado de unos 10 TB la primavera pasada, a más de 700 TB en la actualidad, y sigue comprando soportes de almacenamiento a un ritmo de unos 200 TB por trimestre, según dice el vicepresidente de software Bruce Martin.

“Lo que también está cambiando para nosotros es que no sólo hay cada vez más datos, sino que además hay que tratarlos más deprisa,” asegura. “Para llevar a cabo el tipo de análisis e introducción de datos que estamos haciendo con un precio de 5.000 $, necesitamos una infraestructura que permita secuenciar genomas simultáneamente.”

La empresa empezó el otoño pasado con un único cluster IQ 9000 de Isilon Systems. Desde entonces ha añadido docenas de nodos, los últimos de ellos nodos x 12000 de Isilon, que son los más grandes y más rápidos.

Cuando Martin evaluaba los sistemas NAS, observó que los productos de mayor rendimiento no siempre resultaban fáciles de administrar, y viceversa. “Podríamos haber construido nuestro propio cluster con Lustre o GFS, pero al final optamos por Isilon porque es sencillo de utilizar, y no conlleva mucha carga de administración general,” explica. “Nos centramos en nuestra labor de desarrollo, y no en administrar un gran entorno informático.”

Isilon también admite sistemas operativos y sistemas de archivo múltiples. Complete Genomics lo utiliza para CIFS y NFS y tiene el sistema integrado con programas de control de acceso tanto LDAP como de Directorio Activo. Martin alaba asimismo la fiabilidad del sistema de clusters... “Un sistema tan grande significa que estás peDRiendo unidades constantemente, es algo corriente en cualquier sistema de archivo de estas dimensiones. El comportamiento del sistema al respecto ha resultado muy bueno.”

Reconsiderar la safeguard

La multiplicación de los datos no estructurados y la utilización de un sistema de clusters también le han hecho reconsiderar la safeguard que, en un sistema como este, constituye mucho más que un desafío. “Diría incluso que es impracticable”, declara.

El equipo de desarrollo de productos puede generar hasta 10 TB de datos nuevos al día. Alguna información de la empresa contenida en el cluster se envía para su safeguard mediante NDMP, y la empresa utiliza instantáneas de Isilon, sobre todo para el trabajo de ensayo y de desarrollo. De lo contrario, dice Martin, “nuestra estrategia de protección de datos consiste en ejecutar el sistema Isilon en una configuración N + 3 de alta redundancia.”

Normalmente, el rendimiento del cluster supera 1GB/seg, aunque la empresa aún tiene que preparar plenamente su producto para el lanzamiento. “Espero que Isilon siga mejorando su rendimiento; sobre el papel, parece que podría conseguir un ancho de banda aún mayor utilizando algo del tipo de InfiniBand y Lustre,” dice Martin. “Siempre estamos deseosos de conseguir más rendimiento y densidad.”

La biblioteca de investigación utiliza BlueArc para alimentar a la bestia del sitio web

H.W. Wilson publica materiales de referencia impresos para bibliotecarios e investigadores, y recientemente ha incorporado a la oferta para sus clientes recursos de publicación en CD-ROM y a través de la web. Tras el lanzamiento del producto de la empresa WilsonWeb el año pasado, el Departamento de Informática empezó a evaluar productos que permitieran consolidar un entorno DAS de vital importancia para mejorar el rendimiento.

La empresa tiene unos 20 TB de datos, pero cada día se incorporan nuevos documentos y el rendimiento de transferencia de archivos para casi 20 millones de imágenes de documentos se estaba quedando atrás. El personal de informática evaluó los motores de almacenamiento de NetApp, las cajas de EMC Celerra NAS y el sistema NAS Titan de BlueArc.

Según Lu Parziale, vicepresidente de sistemas de información, el editor eligió BlueArc debido a su utilización de una matriz de puertas programable en campo FPGA (field programmable gate array) que almacena su sistema de archivo en silicio en lugar de en software, mejorando con ello el rendimiento.

En diciembre, H.W. Wilson compró un sistema Titan de 60 TB y lo utiliza para alimentar WilsonWeb. “Nuestros clientes observaron que el tiempo de respuesta de 40 segundos se redujo a entre 5 y 10 segundos para los nuevos contenidos,”, dice Parziale. La empresa sigue importando datos al sistema BlueArc, y según nos dice “su chaché nos permite hacerlo prácticamente sin interrupciones.”

La centralización del almacenamiento ha facilitado las safeguards, y las cabeceras duales de la caja Titan ofrecen mayor redundancia que DAS. “Como negocio basado en la red, tenemos que estar accesibles 24 horas al día y 7 días a la semana. Parte del dispositivo podría quedar fuera de servicio sin que nos enteráramos siquiera hasta al cabo de uno o dos días.”

A Parziale le gustaría que BlueArc mejorara sus capacidades de generación de informes para ofrecer informes personalizables e información más granular sobre los volúmenes virtuales y su correspondencia con el sistema de archivo. “Sería estupendo personalizar los informes para capas concretas de infraestructura”, afirma.

La colaboración creciente del usuario y la recuperación de desastres llevan a las Fuerzas Aéreas a optar por OnStor

La ola de NAS también alcanza al sector militar. Cuando hace dos años el Centro de Ingeniería y Medioambiente de las Fuerzas Aéreas (AFCEE) empezó a observar que sus usuarios compartían cada vez más los archivos, pasó de las matrices Xyratex RAID y del almacenamiento interno con conexión directa a través de 52 servidores a un cluster NAS de OnStor NAS.

AFCEE ha desarrollado lentamente el cluster para incorporal la pasarela NAS Bobcat de OnStor y sistemas Pantera con disco integrado, al tiempo que su capacidad de almacenamiento pasaba de algunos gigabytes a 36 TB. En la actualidad, el centro está añadiendo un segundo sistema para la recuperación de desastres en un emplazamiento secundario. El hecho es que una puerta de enlace nos permite reconsiderar el almacenamiento antiguo que seguimos teniendo,” declara Ralph Miles, administrador de redes de AFCEE.

Aunque los productos Bobcat y Pantera de OnStor se utilizan fundamentalmente como sistemas de NAS en cluster, Miles también está utilizando el disco Pantera en un destino ISCSI con base de software para permitir el almacenamiento en bloques para SharePoint. “Lo quiero todo,” dice. “Quiero la posibilidad de hacer transferencias de bloques para una aplicación, a la vez que conservo el almacenamiento de archivos flexible para los directorios raíz.”

Como la puerta de enlace está organizada en cluster y se puede ampliar rápidamente, y además admite diversas matrices en el back-end, también ha ayudado a Miles a atender las necesidades de almacenamiento ad-hoc. “A veces no hay tiempo para crear un sistema fijo, administrado de forma jerárquica”, asegura.

Aunque los productos Bobcat y Pantera de OnStor se utilizan fundamentalmente como sistemas de NAS en cluster, Miles también está utilizando el disco Pantera en un destino ISCSI con base de software para permitir el almacenamiento en bloques para SharePoint. “Lo quiero todo,” dice. “Quiero la posibilidad de hacer transferencias de bloques para una aplicación, a la vez que conservo el almacenamiento de archivos flexible para los directorios raíz.”

Como la puerta de enlace está organizada en cluster y se puede ampliar rápidamente, y además admite diversas matrices en el back-end, también ha ayudado a Miles a atender las necesidades de almacenamiento ad-hoc. “A veces no hay tiempo para crear un sistema fijo, administrado de forma jerárquica”, asegura.

AFCEE ha desarrollado lentamente el cluster para incorporal la pasarela NAS Bobcat de OnStor y sistemas Pantera con disco integrado, al tiempo que su capacidad de almacenamiento pasaba de algunos gigabytes a 36 TB. En la actualidad, el centro está añadiendo un segundo sistema para la recuperación de desastres en un emplazamiento secundario. El hecho es que una puerta de enlace nos permite reconsiderar el almacenamiento antiguo que seguimos teniendo,” declara Ralph Miles, administrador de redes de AFCEE.

Aunque los productos Bobcat y Pantera de OnStor se utilizan fundamentalmente como sistemas de NAS en cluster, Miles también está utilizando el disco Pantera en un destino ISCSI con base de software para permitir el almacenamiento en bloques para SharePoint. “Lo quiero todo,” dice. “Quiero la posibilidad de hacer transferencias de bloques para una aplicación, a la vez que conservo el almacenamiento de archivos flexible para los directorios raíz.”

Como la puerta de enlace está organizada en cluster y se puede ampliar rápidamente, y además admite diversas matrices en el back-end, también ha ayudado a Miles a atender las necesidades de almacenamiento ad-hoc. “A veces no hay tiempo para crear un sistema fijo, administrado de forma jerárquica”, asegura.

Profundice más

Inicie la conversación

Envíenme notificaciones cuando otros miembros comenten sobre este artículo.

Por favor cree un Nombre de usuario para poder comentar.

- ANUNCIOS POR GOOGLE

Close