Deep Learning and Graph Analytics for Explainable Modeling of Clinical Time-Varying Data Associated with Infectious Diseases
Fecha
2024
Autores
Título de la revista
ISSN de la revista
Título del volumen
Editor
Universidad Rey Juan Carlos
Resumen
Esta tesis doctoral realiza una investigación de las herramientas de ciencia de datos para
abordar dos problemas incipientes en entornos clínicos modernos: la Multiresistencia Antimicrobiana
(MRA) y el Coronavirus 2019 (COVID-19). Al concentrarse en estas dos áreas, la
investigación aborda problemas de salud pública urgentes y de gran impacto. La MRA representa
un desafío creciente en la medicina global, con patógenos que se vuelven resistentes a los
tratamientos antimicrobianos convencionales, lo que complica el manejo de infecciones y aumenta
la mortalidad. Por otro lado, el COVID-19, es una pandemia que ha afectado a millones
de personas en todo el mundo, y sigue presentando desafíos en su control y en la comprensión de
sus patrones de propagación y efectos a largo plazo. La investigación se centra en las Unidades
de Cuidados Intensivos (UCI), identificadas como epicentros críticos para la adquisición de enfermedades
infecciosas. Este enfoque es fundamental debido a la alta vulnerabilidad de los
pacientes en las UCI, quienes a menudo presentan sistemas inmunológicos debilitados y están
expuestos a una variedad de procedimientos invasivos que aumentan el riesgo de infección.
Inicialmente, la tesis aborda un análisis detallado sobre la importancia de la MRA y el
COVID-19, explorando el impacto de estos en aspectos sociales, económicos y en los sistemas
de salud a nivel global y nacional. Se enfatiza la amenaza que suponen la evolución de amenazas
existentes, ejemplificada por el incremento de la MRA y de nuevas patologías como el COVID-
19. Al analizar las complejas repercusiones demográficas y económicas de estas amenazas
sanitarias globales, la investigación subraya la urgencia de adoptar metodologías avanzadas de
análisis de datos, indispensables para gestionar e interpretar la naturaleza compleja de los datos
clínicos, crucial para entender la progresión de estas enfermedades en las UCIs.
El objetivo principal de esta tesis es el diseño de modelos basados en aprendizaje profundo y
análisis de grafos para predecir la aparición de enfermedades infecciosas y extraer conocimiento
clínico. Para llevar a cabo este objetivo, se persigue como primer objetivo específico la creación
de bases de datos para la realización de esta tesis doctoral, implementando diversas técnicas de
modelado e integración de datos. La siguiente contribución específica de esta tesis es el desarrollo
de modelos de datos multimodales interpretables, específicamente diseñados para la
predicción temprana de la MRA. Estos modelos integran datos clínicos tanto estáticos como
dinámicos, y han sido específicamente diseñados para conseguir buenas prestaciones, sin comprometer
la interpretabilidad, aspecto clave en entornos clínicos. Se logra este equilibrio mediante
un modelado adecuado de los datos, incorporando una fase previa de selección de características
y mecanismos específicos para mejorar la interpretabilidad de los modelos. Los
resultados obtenidos han mostrado como utilizando modelos multimodales basados en series temporales pueden mejorar las prestaciones obtenidas para predecir la aparición de MRA en la
ICU. Además, se han identificado aspectos claves en la aparición de gérmenes multirresistentes
como la ventilación mecánica, el número de vecinos MRA o ciertas familias de antibióticos. Estos
modelos no solo son útiles en la detección y manejo temprano de la MRA, sino que también
podrían servir para futuras aplicaciones en otros problemas clínicos.
Finalmente, esta tesis introduce modelos basados en grafos para extraer conocimiento sobre
el COVID-19. Estos modelos de grafos, que representan los datos clínicos como estructuras
nodales interconectadas, son aplicados para descrubir y analizar las complejas relaciones e interdependencias
presentes en los datos clínicos. Empleando técnicas sofisticadas de análisis
de redes, como el análisis de centralidad para identificar nodos clave, estos modelos ofrecen
insights profundos y detallados sobre las dinámicas de transmisión, los patrones de morbilidad
y las respuestas a los tratamientos del COVID-19. Mediante el uso de representaciones
basadas en grafos, este estudio proporciona una perspectiva innovadora en la visualización y
análisis de la interconexión de variables clínicas, revelando patrones y asociaciones complejas.
En concreto, se ha identificado la prevalencia de comorbilidades como hipertensión, diabetes
u obesidad entre otras, así como fiebre o tos como síntomas predominantes. Además algunos
tratamientos como la combinación de lopinavir/ritonavir, hydroxycloroquina, y corticosteroides
fueron identificados como tratamientos frecuentes durante la primera ola del COVID-19.
En conclusion, esta tesis doctoral constituye un trabajo pionero que aplica la ciencia de datos
en el campo de la epidemiología, ofreciendo métodos novedosos y efectivos para el análisis y
la predicción de enfermedades infecciosas. A través de una metodología que incorpora aprendizaje
profundo y análisis de grafos, se ha logrado no solo la creación de modelos predictivos
con buenas prestaciones, sino también una comprensión más profunda de estas enfermedades,
que además pueden ser aplicables en otros casos de uso. La integración de tecnologías de ciencia
de datos en el cuidado de la salud, como se demuestra en esta investigación muestra un
prometedor futuro en la mejora continua de los sistemas de salud global.
Descripción
Tesis Doctoral leída en la Universidad Rey Juan Carlos de Madrid en 2024.
Directores
Cristina Soguero Ruiz
Citación
Colecciones
Excepto si se señala otra cosa, la licencia del ítem se describe como Attribution-NonCommercial-NoDerivatives 4.0 Internacional