Deep Learning and Graph Analytics for Explainable Modeling of Clinical Time-Varying Data Associated with Infectious Diseases

Fecha

2024

Título de la revista

ISSN de la revista

Título del volumen

Editor

Universidad Rey Juan Carlos

Resumen

Esta tesis doctoral realiza una investigación de las herramientas de ciencia de datos para abordar dos problemas incipientes en entornos clínicos modernos: la Multiresistencia Antimicrobiana (MRA) y el Coronavirus 2019 (COVID-19). Al concentrarse en estas dos áreas, la investigación aborda problemas de salud pública urgentes y de gran impacto. La MRA representa un desafío creciente en la medicina global, con patógenos que se vuelven resistentes a los tratamientos antimicrobianos convencionales, lo que complica el manejo de infecciones y aumenta la mortalidad. Por otro lado, el COVID-19, es una pandemia que ha afectado a millones de personas en todo el mundo, y sigue presentando desafíos en su control y en la comprensión de sus patrones de propagación y efectos a largo plazo. La investigación se centra en las Unidades de Cuidados Intensivos (UCI), identificadas como epicentros críticos para la adquisición de enfermedades infecciosas. Este enfoque es fundamental debido a la alta vulnerabilidad de los pacientes en las UCI, quienes a menudo presentan sistemas inmunológicos debilitados y están expuestos a una variedad de procedimientos invasivos que aumentan el riesgo de infección. Inicialmente, la tesis aborda un análisis detallado sobre la importancia de la MRA y el COVID-19, explorando el impacto de estos en aspectos sociales, económicos y en los sistemas de salud a nivel global y nacional. Se enfatiza la amenaza que suponen la evolución de amenazas existentes, ejemplificada por el incremento de la MRA y de nuevas patologías como el COVID- 19. Al analizar las complejas repercusiones demográficas y económicas de estas amenazas sanitarias globales, la investigación subraya la urgencia de adoptar metodologías avanzadas de análisis de datos, indispensables para gestionar e interpretar la naturaleza compleja de los datos clínicos, crucial para entender la progresión de estas enfermedades en las UCIs. El objetivo principal de esta tesis es el diseño de modelos basados en aprendizaje profundo y análisis de grafos para predecir la aparición de enfermedades infecciosas y extraer conocimiento clínico. Para llevar a cabo este objetivo, se persigue como primer objetivo específico la creación de bases de datos para la realización de esta tesis doctoral, implementando diversas técnicas de modelado e integración de datos. La siguiente contribución específica de esta tesis es el desarrollo de modelos de datos multimodales interpretables, específicamente diseñados para la predicción temprana de la MRA. Estos modelos integran datos clínicos tanto estáticos como dinámicos, y han sido específicamente diseñados para conseguir buenas prestaciones, sin comprometer la interpretabilidad, aspecto clave en entornos clínicos. Se logra este equilibrio mediante un modelado adecuado de los datos, incorporando una fase previa de selección de características y mecanismos específicos para mejorar la interpretabilidad de los modelos. Los resultados obtenidos han mostrado como utilizando modelos multimodales basados en series temporales pueden mejorar las prestaciones obtenidas para predecir la aparición de MRA en la ICU. Además, se han identificado aspectos claves en la aparición de gérmenes multirresistentes como la ventilación mecánica, el número de vecinos MRA o ciertas familias de antibióticos. Estos modelos no solo son útiles en la detección y manejo temprano de la MRA, sino que también podrían servir para futuras aplicaciones en otros problemas clínicos. Finalmente, esta tesis introduce modelos basados en grafos para extraer conocimiento sobre el COVID-19. Estos modelos de grafos, que representan los datos clínicos como estructuras nodales interconectadas, son aplicados para descrubir y analizar las complejas relaciones e interdependencias presentes en los datos clínicos. Empleando técnicas sofisticadas de análisis de redes, como el análisis de centralidad para identificar nodos clave, estos modelos ofrecen insights profundos y detallados sobre las dinámicas de transmisión, los patrones de morbilidad y las respuestas a los tratamientos del COVID-19. Mediante el uso de representaciones basadas en grafos, este estudio proporciona una perspectiva innovadora en la visualización y análisis de la interconexión de variables clínicas, revelando patrones y asociaciones complejas. En concreto, se ha identificado la prevalencia de comorbilidades como hipertensión, diabetes u obesidad entre otras, así como fiebre o tos como síntomas predominantes. Además algunos tratamientos como la combinación de lopinavir/ritonavir, hydroxycloroquina, y corticosteroides fueron identificados como tratamientos frecuentes durante la primera ola del COVID-19. En conclusion, esta tesis doctoral constituye un trabajo pionero que aplica la ciencia de datos en el campo de la epidemiología, ofreciendo métodos novedosos y efectivos para el análisis y la predicción de enfermedades infecciosas. A través de una metodología que incorpora aprendizaje profundo y análisis de grafos, se ha logrado no solo la creación de modelos predictivos con buenas prestaciones, sino también una comprensión más profunda de estas enfermedades, que además pueden ser aplicables en otros casos de uso. La integración de tecnologías de ciencia de datos en el cuidado de la salud, como se demuestra en esta investigación muestra un prometedor futuro en la mejora continua de los sistemas de salud global.

Descripción

Tesis Doctoral leída en la Universidad Rey Juan Carlos de Madrid en 2024. Directores Cristina Soguero Ruiz

Citación

Colecciones

license logo
Excepto si se señala otra cosa, la licencia del ítem se describe como Attribution-NonCommercial-NoDerivatives 4.0 Internacional