NAÏVE BAYES COMO HERRAMIENTA PARA LA CLASIFICACIÓN DE PACIENTES CRÓNICOS Y SU MONITORIZACIÓN TEMPORAL
Fecha
2023-07-17
Autores
Título de la revista
ISSN de la revista
Título del volumen
Editor
Universidad Rey Juan Carlos
Resumen
La Historia Clínica Electrónica (HCE) ha permitido registrar digitalmente datos demográficos y clínicos asociados a pacientes. En la extracción automática de conocimiento a partir de grandes cantidades de datos, las herramientas de Machine Learning (ML) han tenido un papel muy relevante y han revolucionado múltiples sectores, entre ellos el sector de la salud, en el que está enfocado este Trabajo Fin de Grado (TFG).
El objetivo de este TFG es la caracterización y monitorización temporal del estado de salud de pacientes crónicos haciendo uso de herramientas de ML que se alimentan de variables clínicas y demográficas. Por la naturaleza progresiva de las enfermedades crónicas, la dimensión temporal adquiere una importancia crucial. En esta línea, un sistema que permita monitorizar y predecir el estado de salud de pacientes crónicos y, a partir de este resultado, establecer medidas de intervención para ralentizar dicha progresión, resulta muy interesante. En concreto, se han estudiado la población de pacientes crónicos asociados al Hospital Universitario de Fuenlabrada con las siguientes cronicidades: diabetes, hipertensión, insuficiencia cardíaca congestiva y enfermedad pulmonar obstructiva crónica. La identificación de los pacientes crónicos se ha realizado utilizando el agrupador poblacional Clinical Risk Group, por estar clínicamente validado.
Como herramienta de ML para caracterizar el estado de salud de los pacientes, se ha usado el clasificador Naïve Bayes (NB), por su simplicidad, eficiencia en el manejo de grandes cantidades de variables y alta interpretabilidad, característica muy valorada en los sistemas de apoyo a la decisión clínica. Para la monitorización temporal se han utilizado ventanas deslizantes, evaluando las ventajas que ofrecería el preprocesamiento de datos considerando un ¿factor de olvido¿ que depende del tiempo transcurrido desde el registro del dato.
Para validar el modelo se han realizado aproximaciones que tienen en cuenta la edad, el sexo y diferentes variables clínicas referentes a un año natural, siendo los códigos asociados a fármacos más informativos que los códigos diagnósticos (aumento del 6 % en la AUC promedio, alcanzando 0.86). En concreto, para los pacientes crónicos complejos que presentan códigos diagnósticos y farmacológicos comunes en distintos grupos de crónicos, se observan mejores resultados al considerar la edad. Existe un aumento cercano al 10 % en los valores de AUC para los grupos de crónicos complejos, siendo algo menor (en torno al 5 %) para los de crónicos simples. En general, el uso de todas las variables incrementa el valor AUC promedio hasta 0.91. Además, aunque la creación de modelos específicos del sexo no proporciona mejores resultados, el procedimiento propuesto ofrece perspectivas prometedoras. Por su parte, los resultados usando información referente a periodos trimestrales muestran que un esquema NB permite monitorizar, con bajo coste computacional, el estado de salud del paciente, alcanzándose para
algunos grupos una tasa de acierto superior a la obtenida con la información anual.
Como líneas de trabajo futuro, se proponen dos paradigmas de aprendizaje. Por un lado, modelos NB que ponderen las variables y/o las observaciones según su proximidad a una instancia de referencia. Por otro lado, usar modelos que durante la propia etapa de diseño tengan en cuenta la dinámica temporal de los datos, como redes neuronales recurrentes.
Descripción
Trabajo Fin de Grado leído en la Universidad Rey Juan Carlos en el curso académico 2022/2023. Directores/as: Inmaculada Mora Jiménez, María Teresa Jurado Camino
Palabras clave
Citación
Colecciones
Excepto si se señala otra cosa, la licencia del ítem se describe como