GENERACIÓN Y EVALUACIÓN DE DATOS SINTÉTICOS DE SERIES TEMPORALES DE GLUCOSA USANDO MÉTODOS BASADOS EN REDES NEURONALES GENERATIVAS
Fecha
2023-07-18
Autores
Título de la revista
ISSN de la revista
Título del volumen
Editor
Universidad Rey Juan Carlos
Resumen
En los últimos años, la prevalencia de la Diabetes Mellitus Tipo 1 (DMT1) ha aumentado
considerablemente a nivel mundial. La DMT1 es una enfermedad crónica que destruye las célu-
las beta del páncreas, provocando una caída en la producción de insulina y una dependencia de
insulina exógena. Los pacientes con DMT1 son más propensos a sufrir episodios de glucemia,
los cuales pueden desencadenar en eventos clínicos graves. Los dispositivos de monitorización
continua de glucosa (CGM, del inglés Continuous Glucose Monitoring) han sido uno de los
avances más sobresalientes para la gestión de la DMT1, favoreciendo el control de niveles de
glucosa, previniendo eventos adversos y mejorando la calidad de vida.
Los modelos basados en Aprendizaje Automático (ML, del inglés Machine Learning) han
marcado un hito en la academia e industria debido a su rendimiento en aplicaciones predicti-
vas. Estos modelos pueden ser usados para predecir valores de glucosa en diferentes horizontes
temporales, permitiendo así prevenir episodios de glucemia. Uno de los grandes desafíos en la
investigación clínica es la disponibilidad de datos de pacientes, pues generalmente estos están
estrictamente regulados. Los avances de la investigación clínica se ve limitados por las restric-
ciones de acceso a los datos. Los modelos basados en redes neuronales adversarias (GANs, del
inglés Generative Adversarial Networks) permiten abordar este problema con la generación de
datos sintéticos que capturan la distribución subyacente de los datos originales.
El presente TFG tiene como objetivo evaluar la efectividad y robustez de modelos ML pa-
ra la generación de series temporales sintéticas con datos de glucosa obtenidas de dispositivos
CGM. En concreto, se han considerado los modelos Conditional Probabilistic AutoRegressive
y Doppel GANs (DGAN). Para la experimentación, tres bases de datos con series temporales de
glucosa de pacientes con DMT1 fueron usadas. Para la evaluación de calidad de los datos sin-
téticos, las divergencias Jensen-Shannon, Maximum Mean Discrepancy (MMD) y la distancia
Dynamic Time Wraping (DTW) fueron consideradas. Adicionalmente, tanto las series tempo-
rales reales como las sintéticas fueron utilizadas en un escenario de predicción (forecasting) en
una ventana temporal de 3 horas.
Los resultados experimentales mostraron que DGAN permite generar series sintéticas con
alta similitud a series temporales reales de glucosa, obteniendo valores razonables de divergen-
cias (Jensen-Shannon, MMD) y DTW. Además, de manera general, las series generadas por
DGAN permitieron obtener mejores resultados en el escenario de forecasting. El presente TFG
contribuye a la evaluación de modelos ML para la generación de series sintéticas, demostrando
la buena calidad de estas series. Esto resulta prometedor pues permitiría predecir valores futuros
de glucosa y así construir un sistema de alerta temprana de episodios glucemia.
Descripción
Trabajo Fin de Grado leído en la Universidad Rey Juan Carlos en el curso académico 2022/2023. Directores/as: Cristian David Chushig Muzo, Cristina Soguero Ruíz
Citación
Colecciones
Excepto si se señala otra cosa, la licencia del ítem se describe como Creative Commons Atribución 4.0 Internacional