michelangelus - Fotolia

Noticias Manténgase informado sobre las más recientes actualizaciones de productos y noticias de tecnología empresarial.

Apache Rya madura la base de datos de código abierto de triple almacenamiento

La tecnología de base de datos de triple almacenamiento de código abierto utilizada por la Marina de los EE. UU. avanza como un proyecto estable y maduro en la Apache Software Foundation.

El esfuerzo de la base de datos de Apache Rya de código abierto continúa avanzando a medida que alcanza un nuevo nivel de madurez y aceptación del proyecto.

Rya es una base de datos de triple almacenamiento RDF (marco de descripción de recursos). El proyecto comenzó en el Laboratorio de Ciencias de las Telecomunicaciones del gobierno de EE. UU. con un documento de investigación inicial publicado en 2012.

El proyecto se unió a la Apache Software Foundation (ASF) en 2015 como un proyecto incubado, y en septiembre de 2019 logró lo que se conoce como estado de proyecto de nivel superior. El estado de nivel superior es una indicación y validación de la madurez del proyecto, la calidad del código y la comunidad. La ASF es el hogar de Hadoop, Spark y otros programas de administración de datos, así como bases de datos ampliamente utilizadas.

Entre los usuarios de Rya se encuentra la Marina de los EE. UU., que está utilizando la tecnología de código abierto en varios esfuerzos, incluido uno para drones autónomos. El proyecto comenzó porque había una necesidad de una triple almacenamiento RDF escalable y ningún sistema existente que cumpliera con todos los requisitos, dijo Adina Crainiceanu, vicepresidenta de Apache Rya y profesora asociada de informática en la Academia Naval de EE. UU.

Almacenamiento triple Apache Rya

El nombre Triple Store se refiere a la estructura de la tabla de la base de datos. Los tres elementos (el "triple") son sujeto, predicado y objeto. El almacenamiento triple funciona con RDF, que es un estándar de la W3C (World Wide Web Consortium) que originalmente se diseñó para crear metadatos para páginas en internet que pueden usarse para expresar cómo una página se conecta a otra. RDF ahora se usa de varias maneras debido a su formato simple.

Un ejemplo del formato de triple almacenamiento se puede encontrar en la declaración "el cielo es azul", en el que "cielo" es el sujeto, "es" actúa como el predicado y "azul" es el objeto.

"Se puede pensar en cada elemento del almacenamiento triple como columnas, y luego cada triple es una fila y toda la base de datos es una tabla", explicó Crainiceanu. "Puede expresar una gran variedad de datos en este formato y creo que la simplicidad del formato es el atractivo".

El lenguaje de consulta SPARQL se utiliza para consultar RDF. Según Crainiceanu, la complejidad en la implementación de una tienda triple radica en cómo hacer que las consultas SPARQL sean rápidas, porque se tienen muchos datos y el formato es simple. Ahí es donde Rya encaja, tratando de hacer consultas SPARQL rápidas para bases de datos de triple almacenamiento. Desde el punto de vista de la arquitectura, Rya se puede implementar sobre Apache Accumulo, que es un almacén de clave/valor distribuido y, opcionalmente, también puede usar MongoDB como almacén de datos.

Uso de Apache Rya

Un usuario de Apache Rya es Modus Operandi, con sede en Melbourne, Florida. El proveedor de gestión de datos, que sirve a las agencias de defensa e inteligencia de los Estados Unidos, fue uno de los primeros en adoptar Rya.

Modus Operandi ha implementado Rya utilizando los backends de Apache Accumulo y MongoDB, para almacenar triples para expresar conceptos, entidades y relaciones extraídas para el producto Modus Operandi Analyst Workbench, dijo Kim Ziehlke, ingeniero de sistemas principal de la compañía. Ziehlke dijo que Modus Operandi emplea lo que ella denominó "inteligencia viva", que es información altamente vinculada, enriquecida y de colaboración que está actualizada, es relevante, calificada por su confiabilidad y presentada en una forma que permite el análisis orquestado de humanos y máquinas.

"Rya es escalable y ofrece una gran opción para el uso de las necesidades de almacenamiento semántico triple", dijo Ziehlke. "El rendimiento general ha sido excelente para la velocidad de carga y consulta".

Próximos pasos

Llevar a Rya a la Apache Software Foundation ha sido una experiencia positiva para Crainiceanu, dijo, aunque reconoció que construir una comunidad es difícil, ya que lleva tiempo atraer desarrolladores que quieran contribuir y ayudar a desarrollar un proyecto de código abierto. Dicho esto, enfatizó que los mentores en la experiencia de incubación en Apache ayudaron al proyecto, brindando el asesoramiento necesario para ayudar a crecer la comunidad y madurar el proyecto.

La prioridad de Apache Rya ahora es continuar construyendo la comunidad y la tecnología. Crainiceanu dijo que un enfoque clave para futuras versiones de Rya es la estandarización. Uno de esos esfuerzos es con la implementación del estándar SPARQL en Rya, que ha pasado por múltiples iteraciones en los últimos años. El objetivo para una futura actualización de Rya es asegurarse de que cumpla con el último estándar SPARQL.

Sobre el autor: Sean Michael Kerner es consultor de TI, entusiasta de la tecnología y experto en tintes, y se sabe que pasa su tiempo libre inmerso en el estudio del idioma klingon y las imágenes satelitales del Área 51. Ha impulsado Token Ring, ha configurado NetWare y es conocido por compilar su propio kernel de Linux. Brinda consultoría a organizaciones de la industria y los medios sobre cuestiones tecnológicas.

Investigue más sobre Bases de datos

Inicie la conversación

Envíenme notificaciones cuando otros miembros comenten sobre este artículo.

Por favor cree un Nombre de usuario para poder comentar.

- ANUNCIOS POR GOOGLE

Close