Bernal Oñate, Carlos Paúl2024-05-202024-05-202024https://hdl.handle.net/10115/32955Tesis Doctoral leída en la Universidad Rey Juan Carlos de Madrid en 2024. Directores: Dr. Enrique Vinicio Carrera Erazo Dr. Francisco Manuel Melgarejo Meseguer Tutor: Dr. José Luis Rojo ÁlvarezAntecedentes. En los últimos años, el avance experimentado por los dispositivos de cómputo junto con el desarrollo de los algoritmos de inteligencia artificial ha permito suministrar gran cantidad de información para entrenar a las redes. En este sentido el análisis tiempo frecuencia provee de una mayor cantidad de rasgos o características para determinados fenómenos naturales que el tradicional análisis en tiempo y amplitud. Siguiendo esta misma ruta, el procesamiento digital de voz y audio, conocido como análisis del contenido de audio, explora el uso de escalas psico acústicas y la división en bandas críticas y adiciona un número considerable de características para el análisis de fenómenos naturales aumentando la cantidad de información a ser analizada y procesada. Existe la tendencia de usar redes extremadamente complejas para solucionar todo tipo de problemas, por lo que exploramos las representaciones de baja dimensionalidad mediante Manifold Learning con la idea de reducir esta complejidad, que las redes sean de fácil interpretación y que a futuro puedan llegar a ser implementadas en dispositivos de bajo costo. En primer lugar, partimos de bases de datos que contienen registros de electrocardiograma (ECG), la primera de ellas contiene fibrilación ventricular (VF, del inglés Ventricular Fibrillation), afección cardíaca conocida por lo letal y difícil de estudiar, dado que su aparición conlleva a la muerte del paciente si no se aplica, en unos pocos minutos, un protocolo de reanimación mediante electroshock. Esta base contiene un número limitado de pacientes, pero sus registros son extensos. La segunda base contiene registros de fibrilación auricular (AF, del inglés Atrial Fibrillation) condición cardíaca cada vez más presente en la población mundial ocasionando deterioro en la calidad de vida en el paciente y el aumento de los gastos en salud de los países. Dados buenos los resultados obtenidos con las primeras señales de fibrilación, se optó por extender el trabajo hacia la vulcanología con la intención de la detección de eventos. Es por eso que la última base contiene registros de micro terremotos producidos por los volcanes Cotopaxi y Llaima. Al contrario de la base de datos de VF, aquí se cuenta con un gran número de registros. Los micro terremotos producidos por los volcanes son usados para intentar predecir una eventual erupción porque son menos peligrosos para los vulcanólogos, ya que no requieren de trabajo en campo, y por ello se ha pretendido mejorar las herramientas que usan los vulcanólogos a través de las características encontradas por los métodos aquí propuestos. Es sabido que dichas predicciones apuntan a sistemas de alerta temprana para minimizar los daños por una posible erupción. El uso de bases de datos de dos volcanes permite aumentar el número de eventos para que las redes sean más generales, con la premisa que los dos volcanes son del tipo estratovolcán, y determinar características en común. Objetivos. Utilizado el análisis tiempo frecuencia, se pretende sacar el máximo provecho al variar los kernels (función de distribución o señal), el tipo de ventana y el tamaño que mejor represente el fenómeno de la fibrilación. El objetivo con los registros de VFes observar su evolución a lo largo del tiempo verificar si existen diferencias visibles y el efecto producido por los fármacos para contrarrestar su aparición y, si es posible, clasificar empleando autoencoders y redes de baja dimensionalidad, de acuerdo con cada uno de estos fármacos. Con la base que contiene registros de AF se pretende detectar dicha arritimia, empleando la reducción de características y redes de baja dimensionalidad. Como último objetivo, se propone emplear todas las herramientas usadas en las fibrilaciones para clasificar los eventos presentes en los micro terremotos y encontrar características nuevas y a la vez similares en los dos volcanes. Metodología. Este tipo de señales comparten el ser generadas por sistemas muy dinámicos aleatorios, además de estar inmersos en ruido dada la forma de la captación de las señales. Por ello ha sido necesario un preprocesamiento para retirar ruido y otros tipos de anomalía debidos a la toma de datos de acuerdo con cada una de los conjuntos de datos. Se debe mencionar que los anchos de banda de los fenómenos se encuentran en pocos hercios, por lo que el uso de estas características resulta idóneo para entender su dinámica y buscar una forma razonable de clasificar sus eventos. Con cada una de las bases de datos y la información obtenida de las características extraídas para cada una de ellas, se probaron varias configuraciones con la intensión de encontrar el mejor rendimiento. Los autoencoders con su estructura de codificador y decodificar fueron las escogidos para la clasificación, dado que su estructura permite reducir el espacio de entrada en variables latentes de baja dimensionalidad en los que abordar la interpretación. Los métodos de reducción características de este tipo producen en el espacio latente agrupaciones locales de los vectores de entrada mapeados, conocidos como manifolds, que permiten una observación subjetiva y objetiva de gráficas tridimensionales de los distintos grupos observables obtenidos en dichos espacios latentes, resultantes de dicho proceso. Por ello, nos permiten utilizar la versatilidad de las redes de aprendizaje profundo. Resultados. Para validar los resultados obtenidos se usaron las métricas de precisión, sensibilidad y aciertos. Los porcentajes de acierto obtenidos fueron elevados y cercanos a otros clasificadores que usan redes extremadamente complejas. Para el caso de la VF, se obtuvo un porcentaje de acierto (en un escenario multiclase) del 74.00%, resultado razonable que, por primera vez, nos permite observar la incidencia del método de bloqueo del sistema nervioso central no descrito en trabajos anteriores. Para la AF, el porcentaje de acierto (con un etiquetado biclásico para la detección de presencia de la misma) alcanza el 94.50 %, lo cual se considera un resultado bueno si se recuerda que es una red de baja complejidad, y por tanto, que puede ser implementada en dispositivos de monitoreo y como una posible alerta para médicos especialistas. Para el caso de los micro-terremotos, el porcentaje de acierto fue 94.44% para el volcán Llaima y 95.45% para el volcán Cotopaxi, resultados muy próximos a los proporcionados por redes muy complejas, si bien lo primordial de estos resultados es que se logró determinar la existencia de características en común entre los volcanes, y en particular, dos características tienen una presencia fuerte tanto para el volcán Cotopaxi como el Llaima y son el Spectral Flux y el Spectral Rolloff Point. Con estas dos características y su interpretación física puede trazarse una analogía entre los eventos presentes en micro terremotos y el procesamiento de voz en cuanto a la clasificación de los sonidos en sonoros y no sonoros, y las implicaciones en cuanto a los modelos matemáticos de síntesis de la voz. Conclusiones. De los resultados obtenidos podemos concluir que las representaciones tiempo-frecuencia siguen siendo una herramienta versátil para empezar el análisis de cualquier tipo de señal, desde los registros cardíacos de fibrilaciones hasta los registros volcánicos de micro terremotos. El kernel usado demostró versatilidad y el tamaño óptimo de ventana permitió comprobar que un espectro con más detalles o un espectro suavizado proporcionan, dentro de un rango, espacios latentes con propiedades similares. La clasificación realizada por los autoencoders en registros de VF fue buena en comparación con trabajos anteriores, puesto que no solo alcanzó prestaciones notables en la detección de la mediación de diferentes tipos de fármacos, sino que además pudo detectar el método de bloqueo del sistema nervioso central, gracias a las características entregadas a la red en el espacio de entrada y proporcionadas por dicha red en el espacio latente de baja dimensionalidad. En el estudio de la AF, se utilizaron métodos de selección de características y redes de baja dimensionalidad. Se obtuvieron resultados positivos, comparables a otras propuestas en la literatura científica que emplearon redes más complejas y un número considerable de características. En cuanto a la aplicación en los micro terremotos, este es uno de los primeros trabajos que trata de establecer características en común entre dos volcanes de la misma familia o clasificación además de conseguir buenos porcentajes de acierto en la clasificación de los eventos. Una vez más, el escoger el método de reducción de características potenció las prestaciones obtenidas y permitió determinar similitudes entre las características. De manera general, podemos concluir que las características utilizadas tienden a representar de buena manera los fenómenos de las fibrilaciones cardíacas y de los micro terremotos. Con los porcentajes de aciertos obtenidos, cercanos a trabajos con redes extremadamente complejas, dejamos una puerta abierta para investigar estructuras más simples que redunden en procesos rápidos y fáciles de interpretar.engAttribution-NonCommercial-NoDerivatives 4.0 Internacionalhttp://creativecommons.org/licenses/by-nc-nd/4.0/Tecnologías de la Información y las ComunicacionesTIME-FREQUENCY ANALYSIS, AUDIO-BASED FEATURES, AND LOW-DIMENSIONAL MANIFOLD LATENT SPACES IN CARDIAC AND SEISMOGRAPHIC SIGNALSinfo:eu-repo/semantics/doctoralThesisinfo:eu-repo/semantics/openAccess