Noticias Manténgase informado sobre las más recientes actualizaciones de productos y noticias de tecnología empresarial.

GlaxoSmithKline crea plataforma de datos con Hadoop para compartir datos científicos

GlaxoSmithKline está haciendo un mejor uso de los datos que tiene sobre el desarrollo y los ensayos de medicamentos a través de una plataforma basada en Hadoop.

La firma farmacéutica GlaxoSmithKline (GSK) ha mejorado sus capacidades de investigación y desarrollo (I+D) a través de un programa que permite el intercambio de datos del desarrollo de medicamentos en todo el departamento de I+D.

En 2015, GSK se embarcó en una estrategia de datos para abordar un desafío al compartir datos causado por la fragmentación de datos y el formato diferente de los datos en todo el departamento de I+D.

Hay alrededor de 10.000 científicos en la operación de I+D de GSK, pero muy pocos datos compartidos sobre el desarrollo y ensayos de medicamentos.

Antes de la estrategia de datos, que ahora tiene tres años, todos los datos de ensayos y experimentos de medicamentos se realizaban en diferentes formatos y se almacenaban en diferentes lugares, dijo Mark Ramsey, quien fue contratado como director de datos para la operación de I+D de GSK en 2015.

Él dijo que se había hecho algo de trabajo sobre el almacenamiento de datos tradicional en el pasado, con intentos de estructurar y organizar los datos utilizando tecnologías como Oracle y Teradata. "Pero lo que realmente estábamos buscando era algo para abordar el problema en una escala más amplia", dijo Ramsey.

"Las compañías farmacéuticas producen una gran cantidad de datos, pero se produce en silos verticales", dijo. "Por ejemplo, en el descubrimiento se producen datos experimentales que se utilizan para progresar en nuevos medicamentos individuales, pero realmente no existía la capacidad de compartir esa información en toda la organización de I+D y de utilizar el poder de la agregación de esa información para tomar mejores decisiones".

GSK reconoció que esto era una limitación, por lo que reclutó a Ramsey como director de datos para definir una estrategia de datos para toda la I+D, por lo que la información podría utilizarse como un activo estratégico en lugar de solo para las operaciones.

Él comenzó identificando dónde estaba el departamento en términos del uso de datos. "Inicialmente hice una encuesta en toda la población de investigación y desarrollo de unos 10.000 científicos utilizando Competing with Data del MIT, que mide la madurez de los datos, y obtuve una tasa de respuesta muy alta", dijo.

"En general, los comentarios confirmaron la hipótesis de que las personas podían acceder a los datos que creaban ellos mismos, pero que realmente no podían compartir".

Luego hizo una evaluación de lo que se había hecho en el pasado en términos de crear una plataforma de información integrada y descubrió que realmente no se había enfocado un esfuerzo en I+D para compartir datos y que la tecnología necesaria para hacerlo no estaba instalada.

Cuando la organización desarrolla medicamentos, los científicos hacen experimentos. Entonces tiene miles de científicos haciendo experimentos sobre compuestos específicos y cosas mientras intentan determinar si es un éxito o no. Pero en GSK, todos estaban haciendo estos experimentos basados en programas individuales. "Pero es valioso poner todos esos experimentos juntos", dijo Ramsey.

"Antes de comenzar un experimento, pueden analizar todos los experimentos similares ya realizados y obtener información de ellos. El peor de los casos es que alguien haga un experimento que ya se haya realizado", dijo.

La organización también realiza muchos ensayos clínicos. Esto se hace con ciertos resultados enfocados que están tratando de lograr. Los lograrán, o no. "Pero si no junta todos los ensayos clínicos, pierde el valor de ese conocimiento agregado".

Reuniendo información

La organización tomó la decisión de utilizar Hadoop como base para darle la capacidad de reunir toda la información de diferentes fuentes operativas en el formato correcto para que pudieran comenzar a seleccionarla y racionalizarla. Hadoop es un software de código abierto para poder almacenar datos estructurados y no estructurados.

La compañía tuvo que empezar desde cero. "Pusimos en marcha una nueva plataforma porque la tecnología no se había utilizado antes en GSK", dijo Ramsey.

GSK luego integró una serie de otras tecnologías para llevar los datos a la plataforma y racionalizarlos.

El ejecutivo dijo que el proyecto nunca terminará porque el equipo de datos está constantemente perfeccionando las cosas y buscando nuevos casos de uso. La mayor parte del trabajo se completó internamente, en sus centros globales, sin utilizar ninguna de las relaciones de integrador de sistemas tradicionales, pero sí funciona con varios especialistas más pequeños en áreas como ciencia de datos y análisis.

Con este fin, GSK ha creado un ecosistema de alrededor de una docena de proveedores de software más pequeños para respaldar la plataforma. Esto incluye la startup Waterline Data, con sede en California, por ejemplo, que proporciona tecnología de repositorio de metadatos. Esto garantiza que una vez que los datos están en la plataforma, podemos buscarlos y ver dónde existe la información y quién la ha utilizado en el pasado.

GSK también está analizando el uso de la inteligencia artificial en el desarrollo de nuevos medicamentos utilizando tecnología de supercomputación.

Este artículo se actualizó por última vez en mayo 2018

Profundice más

Inicie la conversación

Envíenme notificaciones cuando otros miembros comenten sobre este artículo.

Por favor cree un Nombre de usuario para poder comentar.

- ANUNCIOS POR GOOGLE

Close