Sergey Nivens - Fotolia

Evaluar Conozca los pros y contras de las tecnologías, productos y proyectos que está considerando.

Recursos de datos de COVID-19 para científicos de datos voluntarios

Muchos científicos de datos buscan investigar el nuevo coronavirus y las formas de combatir el brote continuo. Siga leyendo para conocer los principales recursos de datos de COVID-19 para investigadores voluntarios.

A medida que el mundo se enfrenta a la pandemia de COVID-19, están surgiendo varios esfuerzos para aprovechar el talento de analistas, desarrolladores de IA e ingenieros de datos. Estas iniciativas pueden proporcionar a las personas y equipos la oportunidad de hacer algo significativo, trabajar con otros y aprender nuevas habilidades.

«Sin duda, se deben construir modelos estadísticos y predictivos para servir a la comunidad científica, que está trabajando arduamente para comprender el virus, la eficacia del tratamiento y desarrollar vacunas», dijo Joshua Swartz, socio en transformación digital de Kearney, una empresa de consultoría en estrategia y gestión global. «Lo que los desarrolladores pueden hacer es ayudar a la comunidad científica a realizar estos análisis y dar sentido a los resultados».

Pivotando por la causa

Varios proveedores están saltando para ofrecer sus propios talentos únicos también.

David Leichner, director de marketing de SQream, un proveedor de almacenamiento de datos de GPU SQL, dijo que están trabajando en los esfuerzos voluntarios previos en torno a la investigación del cáncer y el análisis de ADN para encontrar correlaciones de varios indicadores para construir un modelo de riesgo que tenga en cuenta la demografía, la densidad de las áreas urbanas , hábitos de fumar y más.

Sean Knight, jefe de marketing de Knowi, una plataforma de análisis unificada, dijo que su empresa ha cambiado la mayor parte de su talento de desarrollador para construir paneles para ayudar a rastrear la propagación del coronavirus. El objetivo es ofrecer un lugar gratuito de confianza donde las personas puedan seguir la propagación del COVID-19. Los analistas también pueden incorporarlos en sus propias aplicaciones.

CORD-19

El proyecto coordinado más grande de los muchos recursos de datos sobre COVID-19 es probablemente el Reto de conjunto de datos de investigación abierta Kaggle COVID-19, también llamado CORD-19. Fue impulsado por un llamado a la acción de la Casa Blanca y reúne premios, fuentes de datos y oportunidades de colaboración para analistas de datos que desean ayudar.

CORD-19 pide a los participantes que resuelvan las preguntas actuales desarrollando herramientas de minería de datos y texto para varios conjuntos de datos y miles de artículos e informes científicos.

«La llamada se emitió con la esperanza de que AI y otras herramientas puedan usarse para ayudar a encontrar respuestas a un conjunto clave de preguntas sobre COVID-19», dijo Phil Gurbacki, vicepresidente senior de soporte de productos y clientes de DataRobot.

El conjunto de datos en bruto incluye más de 44.000 artículos académicos sobre varios coronavirus y la secuenciación completa del ARN del virus. Hay una variedad de tareas y subtareas de alto nivel que los investigadores deben ayudar a resolver.

Las tareas de alto nivel incluyen preguntas como: «¿Qué se sabe sobre transmisión, incubación y estabilidad ambiental?». Las subtareas requieren respuestas a preguntas como: «¿Cuál es el rango de períodos de incubación?», «¿Cuál es la estacionalidad de las transmisiones?» y «¿Cuál es la prevalencia de transmisión asintomática?».

EndCoronavirus (FinAlCoronavirus)

El esfuerzo EndCoronavirus fue construido y mantenido por el New England Complex Systems Institute (NECSI) y sus colaboradores con el objetivo de minimizar el impacto de COVID-19 al proporcionar datos útiles y pautas para la acción. Ha crecido rápidamente a más de 2.100 voluntarios y está buscando más.

Los participantes pueden perfeccionar sus habilidades en el análisis de redes, el modelado basado en agentes, el análisis a múltiples escalas y la complejidad.

Stephanie So, fundadora y CDO de Geeq, una startup de blockchain, dijo que todos trabajan en Slack. El equipo emplea una gama de herramientas matemáticas diseñadas para sistemas con muchos componentes interactivos en los que se rompen los supuestos estadísticos tradicionales.

Conjuntos de datos de COVID-19

Otros grupos están trabajando en la recopilación de recursos de datos de COVID-19 que pueden ser útiles para varios tipos de análisis y el desarrollo de nuevas aplicaciones.

«La crisis de COVID-19 ha destacado cómo diferentes grupos con habilidades únicas pueden trabajar juntos de manera distribuida muy rápidamente», dijo Andrew Eye, CEO y cofundador de ClosedLoop.ai, una plataforma de ciencia de datos centrada en la atención médica.

Él dijo que algunos de los principales grupos que capturan y agregan conjuntos de datos incluyen Worldometer COVID-19 Statistics y Johns Hopkins, que tiene un conjunto de datos y un panel visual en GitHub. Estos datos también se han recopilado con acceso gratuito en AWS.

Acceso gratuito a la supercomputadora

Varios laboratorios gubernamentales y proveedores de nube privada, incluidos IBM y AWS, están haciendo que sus computadoras de alto rendimiento estén disponibles para analistas de datos con ideas novedosas para analizar datos relacionados con COVID-19 a través del Consorcio HPV COVID-19. Los organizadores están poniendo a disposición de los analistas de datos más de 330 petaflops, 775.000 núcleos de CPU y 34.000 GPU (y contando).

Este programa proporciona soporte técnico y créditos promocionales en los servicios en la nube necesarios para ejecutar estas cargas de trabajo también. Por ejemplo, Amazon ha ofrecido a los investigadores que trabajan en proyectos de tiempo crítico el uso de AWS para acceder instantáneamente a una capacidad de infraestructura prácticamente ilimitada.

Otros recursos

Varias otras organizaciones también están poniendo a disposición sus herramientas y recursos para proyectos de COVID-19.

«Los desarrolladores, científicos de datos y otros miembros de la comunidad tecnológica pueden comenzar a involucrarse en la respuesta al coronavirus aprovechando las innumerables plataformas y herramientas disponibles para el público», dijo Gurbacki de DataRobot.

DataRobot pone a disposición de los investigadores sus productos de aprendizaje automático y preparación de datos Paxata de forma gratuita.

Topcoder, una compañía desarrolladora de crowdsourcing, lanzó el desafío Topcoder Anti-Coronavirus Hackathon.

«El objetivo es encontrar una nueva aplicación, algoritmo o sitio web para ayudar a las personas durante este tiempo novedoso», dijo Michael Morris, CEO de Topcoder.

The Deep Learning Coronavirus Cure está utilizando el aprendizaje profundo para generar nuevas moléculas como candidatos para una cura para el nuevo virus. Y OpenCovid19 está trabajando en varias herramientas de análisis de datos y del mundo real para probar COVID-19 de manera segura utilizando herramientas comunes.

Investigue más sobre Tendencias de cómputo empresarial

Inicie la conversación

Envíenme notificaciones cuando otros miembros comenten sobre este artículo.

Por favor cree un Nombre de usuario para poder comentar.

Close