Desde el Ontology Engineering Group de la Escuela Técnica Superior de Ingenieros Informáticos de la Universidad Politécnica de Madrid lanzan esta iniciativa abierta para intentar dar a la comunidad científica y médica respuestas a algunas de sus preguntas a partir del análisis de la literatura científica que se ha publicado sobre el COVID-19.
Desde hace unas semanas, el Allen Institute for Artificial Intelligence mantiene un corpus actualizado de artículos científicos sobre COVID-19. A fecha de 27 de marzo de 2020, este corpus contiene más de 44.000 artículos en inglés, con el texto completo de más de 29.000 artículos.
Esta ingente cantidad de literatura científica que se ha generado en apenas unos meses desde la aparición del virus, demuestra la gran actividad científica para su estudio. Pero al mismo tiempo, este corpus es tan grande que se ha convertido en un problema para que científicos y médicos puedan encontrar información específica sobre algún tipo de tratamiento que se haya probado en algún grupo específico de la población, relaciones entre tratamientos, resultados obtenidos, etc. Esto es lo que normalmente se conoce como sobrecarga de información.
El 16 de marzo del 2020, la Oficina de Política Científica y Tecnológica de la Casa Blanca realizó un llamamiento a la comunidad internacional de Inteligencia Artificial para el desarrollo de técnicas de procesamiento de lenguaje natural y minería de textos que ayudaran a resolver preguntas que la comunidad científica se está realizando sobre el COVID-19. Muchas de estas preguntas, formuladas por médicos y científicos, están recogidas en la plataforma Kaggle, bien conocida por la comunidad de Ciencia de Datos e Inteligencia Artificial. A fecha de 27 de marzo, hay ya más de 400 iniciativas y contribuciones registradas, donde se han hecho distintos tipos de tratamientos de los textos que han sido proporcionados para responder a distintos grupos de preguntas.
En el Ontology Engineering Group de la Escuela Técnica Superior de Ingenieros Informáticos de la Universidad Politécnica de Madrid llevan trabajando varios años en el procesamiento de grandes corpus de textos, así que desde la semana pasada se han puesto a trabajar para intentar aportar su grano de arena en la solución de estos problemas, desarrollando el core de una tecnología que permita a otros investigadores, estudiantes e informáticos trabajar sobre ella. En la siguiente página describen lo que han hecho hasta ahora, y los recursos que ponen a disposición del resto de la comunidad científica, por si pudieran resultar útiles: https://oeg-upm.github.io/covid19/
Asimismo, hacen un llamamiento a todos aquellos que queráis colaborar en esta iniciativa abierta a toda la comunidad española en Inteligencia Artificial (investigadores, desarrolladores, estudiantes) con nuevas preguntas, con nuevos algoritmos que resuelvan algunas de las preguntas que la comunidad científica y médica se está realizando, con la validación de los resultados que han obtenido hasta ahora, con herramientas de visualización más amigable para los médicos, o con cualquier otra cosa que se os ocurra. Juntos podemos construir una plataforma con un conjunto de herramientas que puedan ser útiles para todos.
No dudéis en contactarles a través del repositorio https://github.com/librairy/covid19 (para desarrolladores) o directamente a su dirección de correo (moeg-covid19@delicias.dia.fi.upm.es).