BACKGROUND IMAGE: iSTOCK/GETTY IMAGES

Este contenido es parte de Guía Esencial: ¿Hacia dónde van la analítica y big data en las empresas?
Noticias Manténgase informado sobre las más recientes actualizaciones de productos y noticias de tecnología empresarial.

Iniciativa apunta a la gestión de datos Hadoop y a mejores políticas de datos

Hortonworks forma una iniciativa de gestión de datos en Hadoop con Merck y otros. Mientras tanto, SQL y NoSQL pueden desdibujarse un poco.

Las personas que buscan hacer un seguimiento de los movimientos del promotor de Hadoop Hortonworks, en la estela de su reciente salida a bolsa, reflexionarán con la noticia de que la compañía está impulsando una mejor gestión de datos en Hadoop. El movimiento toma la forma de una iniciativa de gobierno de datos que incluye a Aetna, Merck y otros. También hubo noticias de una encuesta de Forrester Research que muestra a muchos profesionales de la gestión de datos  mirando hacia un día en que SQL y NoSQL corran juntos en una plataforma.

Hortonworks busca a Aetna y Merck para unirse a la iniciativa de gobierno Hadoop

Recién salido de la recaudación de 100 millones de dólares en su salida a bolsa en diciembre, el distribuidor de la plataforma Hadoop, Hortonworks, Inc., dijo que estaba formando una iniciativa de gobierno de datos con sus clientes Aetna, Merck y Target, así como con el socio de tecnología SAS. El objetivo final es proporcionar un mayor nivel de gestión de datos en Hadoop, y a su vez mover a Hadoop más a fondo en la informática empresarial.

El gobierno de datos es uno de los elementos clave del que Hadoop carece en su intento de salir de la etapa de prueba de concepto y meterse más profundamente en las operaciones de empresas reconocidas. El gobierno de datos es un tema crítico para big data, sobre todo en las empresas financieras, donde las regulaciones de cumplimiento son estrictas.

La compañía está trabajando con los usuarios finales para crear un motor de reglas flexibles, capaz de hacer cumplir los flujos de trabajo de datos que satisfagan las necesidades de las reglas de cumplimiento, dijo Andrew Ahn, director de gobernanza de Hortonworks. El software desarrollado como parte de la iniciativa incluirá la gestión del ciclo de vida Apache Falcon, el marco de seguridad Apache Ranger y un nuevo motor de reglas de políticas que incluye un almacén de datos de auditoría que puede contener metadatos pertinentes.

Ahn está familiarizado con los entresijos de big data para finanzas y conoce sus necesidades sobre la base de sus temporadas en el desarrollo de aplicaciones en la Bolsa de Valores de Nueva York y la Bolsa del Pacífico. Una gran parte del esfuerzo de big data es de "custodia", dijo.

"Tuvimos problemas críticos entre el gobierno y los grandes datos", dijo, señalando la necesidad de cumplir con las restricciones de la Comisión de Bolsa y Valores (SEC) de EE.UU. Las grandes empresas se enfrentan a retos similares a medida que avanzan sus implementaciones avanzadas de Hadoop hacia la producción, dijo.

La SEC y otros reguladores requieren que las empresas mantengan senderos auditables de datos transaccionales. Si bien Falcon puede fijar la política algunos sistemas, se necesita un nivel más fino de procesamiento de políticas para muchas empresas; es por ello que hicieron la nueva iniciativa.

Hortonworks anticipa un lanzamiento de software tan pronto como dentro de este trimestre, dijo Ahn.El plan es hacer un seguimiento con una propuesta formal para convertirse en un proyecto de incubación dentro de la Apache Software Foundation.

SQL a NoSQL: ‘¿Algún día estaremos juntos?'

Más de unas pocas personas han descartado el aumento de las bases de datos NoSQL que han subido a desafiar al titular SQL. Después de todo, SQL luchó contra las incursiones antes –las bases de datos orientadas a objetos en la década de 1990 son un buen ejemplo– mediante la adición de capacidades.

Las bases de datos SQL continúan añadiendo capacidades actualmente. Un área clara es Javascript Object Notation (JSON). Gran parte del aumento de NoSQL se posaba en JSON. Pero las bases de datos relacionales de IBM, Oracle, Microsoft, Teradata, EnterpriseDB Corp. y otros han añadido soporte en los últimos meses.

Un factor que impulsa el tratar de consolidar las operaciones de SQL y NoSQL en una base de datos es el soporte. La idea de construir una infraestructura completamente nueva para dos tipos de bases de datos distintas –SQL y NoSQL– recoge reacciones mezcladas. Esa idea está respaldada por un estudio que Forrester Research hizo para el fabricante de PostgreSQL, EnterpriseDB. El estudio combinó material del Business Technographics de Forrester y otras investigaciones, así como los datos de una encuesta personalizada realizada a 50 tomadores de decisiones de TI con sede en EE.UU., responsables de la arquitectura de la empresa o el desarrollo de aplicaciones.

Los datos de Forrester muestran que el 42% de todos los encuestados quieren integrar las bases de datos NoSQL con las relacionales. Mientras tanto, el 36% de los encuestados desea almacenar datos estructurados y no estructurados juntos en su base de datos estándar. Podría pasar un largo tiempo antes de que las ofertas hechas y derechas se produzcan, pero es justo decir que los proveedores están trabajando ahora para tratar de absorber los rasgos más populares de las bases de datos NoSQL.

Inicie la conversación

Envíenme notificaciones cuando otros miembros comenten sobre este artículo.

Por favor cree un Nombre de usuario para poder comentar.

- ANUNCIOS POR GOOGLE

Close