Hijosa Guzmán, Daniel2023-07-242023-07-242023-07-21https://hdl.handle.net/10115/23713Trabajo Fin de Grado leído en la Universidad Rey Juan Carlos en el curso académico 2022/2023. Directores/as: Inmaculada Mora Jiménez, María Teresa Jurado CaminoEn cuanto a la salud se refiere, en los países desarrollados y debido fundamentalmente al aumento de la esperanza de vida, ha habido un cambio de paradigma en las últimas décadas, pasando de la prevalencia de patologías agudas a patologías crónicas. Esta mayor prevalencia de las enfermedades crónicas, de carácter prolongado en el tiempo, implica una gran fuente de inversión en los sistemas sanitarios. Además, la digitalización e informatización de los servicios sanitarios ha resultado en la creación de la Historia Clínica Electrónica (HCE), que permite almacenar una enorme cantidad de datos demográficos y clínicos de los pacientes. Concretamente, en este Trabajo de Fin de Grado se emplean registros de códigos farmacológicos asociados a pacientes crónicos, vinculados al Hospital Universitario de Fuenlabrada, considerando pacientes crónicos (simples o complejos) hipertensos, diabéticos, con insuficiencia cardiaca y con enfermedad pulmonar obstructiva crónica. La enorme cantidad de datos recogidos en la HCE puede ser analizada con técnicas de Machine Learning (ML), que permiten identificar patrones ocultos para extraer conocimiento y desarrollar sistemas de apoyo a la decisión médica. De hecho, el seguimiento temporal de pacientes está asociado a datos longitudinales, siendo posible la aplicación de modelos secuenciales para predecir la evolución clínica del paciente. Este proyecto tiene como objetivo diseñar modelos secuenciales de ML para abordar la predicción del riesgo clínico asociado a pacientes crónicos. De entre los registros disponibles en la HCE, en este proyecto se consideran registros de códigos farmacológicos, a fin de evaluar su potencial en este escenario debido a la facilidad de automatización en su recogida. Para hacer frente a ese objetivo es necesario superar las dificultades inherentes al tratamiento de datos secuenciales, como el muestreo no uniforme. A este respecto destaca el preprocesamiento realizado en el proyecto con una ventana móvil de tres meses. Tras este preprocesamiento, se han diseñado varios modelos de redes neuronales recurrentes (modelos secuenciales), incluyendo aproximaciones con datos demográficos y etapas de embedding, para establecer un contexto y reducir el impacto de los vectores sparse, respectivamente. El objetivo es determinar qué aproximación se adapta mejor a la tarea de predicción del riesgo clínico en pacientes crónicos, así como conocer el impacto de incluir una etapa demográfica y de embedding. Los resultados muestran que la arquitectura formada por el modelo secuencial Gated Recurrent Unit (GRU) y GRU con capa demográfica ofrecen valores de tasa de acierto muy buenos en los pacientes con cronicidades únicas (valores superiores al 70%) y razonables en las multicronicidades (mayoritariamente valores superiores al 50%) teniendo en cuenta que se está abordando una tarea multiclase. Se concluye que ambos modelos pueden ser de gran utilidad como sistemas de ayuda para predecir el riesgo clínico de pacientes crónicos, aunque la arquitectura de GRU tiene mejores prestaciones al ofrecer mejor tasa de acierto en los grupos de crónicos complejos. Como línea de trabajo futuro se propone, por un lado, un diseño con más grupos de pacientes crónicos y, por otro lado, un diseño de embedding que permita establecer relaciones entre las funciones o efectos que tiene los fármacos sobre el organismo.spaMachine learningPacientes crónicosModelos SecuencialesREDES SECUENCIALES PARA PREDECIR EL RIESGO CLÍNICO DE PACIENTES CRÓNICOS USANDO CÓDIGOS FARMACOLÓGICOSinfo:eu-repo/semantics/studentThesisinfo:eu-repo/semantics/embargoedAccess