TIME-FREQUENCY ANALYSIS, AUDIO-BASED FEATURES, AND LOW-DIMENSIONAL MANIFOLD LATENT SPACES IN CARDIAC AND SEISMOGRAPHIC SIGNALS

Fecha

2024

Título de la revista

ISSN de la revista

Título del volumen

Editor

Universidad Rey Juan Carlos

Resumen

Antecendentes. En los ´ultimos a˜nos, el avance experimentado por los dispositivos de c´omputo junto con el desarrollo de los algoritmos de inteligencia artificial ha permito suministrar gran cantidad de informaci´on para entrenar a las redes. En este sentido el an´alisis tiempo frecuencia provee de una mayor cantidad de rasgos o caracter´ısticas para determinados fen´omenos naturales que el tradicional an´alisis en tiempo y amplitud. Siguiendo esta misma ruta, el procesamiento digital de voz y audio, conocido como an´alisis del contenido de audio, explora el uso de escalas psicoac´usticas y la divisi´on en bandas cr´ıticas y adiciona un n´umero considerable de caracter´ısticas para el an´alisis de fen´omenos naturales aumentando la cantidad de informaci´on a ser analizada y procesada. Existe la tendencia de usar redes extremadamente complejas para solucionar todo tipo de problemas, por lo que exploramos las representaciones de baja dimensionalidad mediante Manifold Learning con la idea de reducir esta complejidad, que las redes sean de f´acil interpretaci´on y que a futuro puedan llegar a ser implementadas en dispositivos de bajo costo. En primer lugar, partimos de bases de datos que contienen registros de electrocardiograma (ECG), la primera de ellas contiene fibrilaci´on ventricular (VF, del ingl´es Ventricular Fibrillation), afecci´on card´ıaca conocida por lo letal y dif´ıcil de estudiar, dado que su aparici´on conlleva a la muerte del paciente si no se aplica, en unos pocos minutos, un protocolo de reanimaci´on mediante electroshock. Esta base contiene un n´umero limitado de pacientes, pero sus registros son extensos. La segunda base contiene registros de fibrilaci´on auricular (AF, del ingl´es Atrial Fibrillation) condici´on card´ıaca cada vez m´as presente en la poblaci´on mundial ocasionando deterioro en la calidad de vida en el paciente y el aumento de los gastos en salud de los pa´ıses. Dados buenos los resultados obtenidos con las primeras se˜nales de fibrilaci´on, se opt´o por extender el trabajo hacia la vulcanolog´ıa con la intenci´on de la detecci´on de eventos. Es por eso que la ´ultima base contiene registros de micro terremotos producidos por los volcanes Cotopaxi y Llaima. Al contrario de la base de datos de VF, aqu´ı se cuenta con un gran n´umero de registros. Los micro terremotos producidos por los volcanes son usados para intentar predecir una eventual erupci´on porque son menos peligrosos para los vulcan´ologos, ya que no requieren de trabajo en campo, y por ello se ha pretendido mejorar las herramientas que usan los vulcan´ologos a trav´es de las caracter´ısticas encontradas por los m´etodos aqu´ı propuestos. Es sabido que dichas predicciones apuntan a sistemas de alerta temprana para minimizar los da˜nos por una posible erupci´on. El uso de bases de datos de dos volcanes permite aumentar el n´umero de eventos para que las redes sean m´as generales, con la premisa que los dos volcanes son del tipo estratovolc´an, y determinar caracter´ısticas en com´un. Objetivos. Utilizado el an´alisis tiempo frecuencia, se pretende sacar el m´aximo provecho al variar los kernels (funci´on de distribuci´on o se˜nal), el tipo de ventana y el tama˜no que mejor represente el fen´omeno de la fibrilaci´on. El objetivo con los registros de VFes observar su evoluci´on a lo largo del tiempo verificar si existen diferencias visibles y el efecto producido por los f´armacos para contrarrestar su aparici´on y, si es posible, clasificar empleando autoencoders y redes de baja dimensionalidad, de acuerdo con cada uno de estos f´armacos. Con la base que contiene registros de AF se pretende detectar dicha arrtimia, empleando la reducci´on de caracter´ısticas y redes de baja dimensionalidad. Como ´ultimo objetivo, se propone emplear todas las herramientas usadas en las fibrilaciones para clasificar los eventos presentes en los micro terremotos y encontrar caracter´ısticas nuevas y a la vez similares en los dos volcanes. Metodolog´ıa. Este tipo de se˜nales comparten el ser generadas por sistemas muy din´amicos aleatorios, adem´as de estar inmersos en ruido dada la forma de la captaci´on de las se˜nales. Por ello ha sido necesario un preprocesamiento para retirar ruido y otros tipos de anomal´ıa debidos a la toma de datos de acuerdo con cada una de los conjuntos de datos. Se debe mencionar que los anchos de banda de los fen´omenos se encuentran en pocos hercios, por lo que el uso de estas caracter´ısticas resulta id´oneo para entender su din´amica y buscar una forma razonable de clasificar sus eventos. Con cada una de las bases de datos y la informaci´on obtenida de las caracter´ısticas extra´ıdas para cada una de ellas, se probaron varias configuraciones con la intensi´on de encontrar el mejor rendimiento. Los autoencoders con su estructura de codificador y decodificar fueron las escogidos para la clasificaci´on, dado que su estructura permite reducir el espacio de entrada en variables latentes de baja dimensionalidad en los que abordar la interpretaci´on. Los m´etodos de reducci´on caracter´ısticas de este tipo producen en el espacio latente agrupaciones locales de los vectores de entrada mapeados, conocidos como manifolds, que permiten una observaci´on subjetiva y objetiva de gr´aficas tridimensionales de los distintos grupos observables obtenidos en dichos espacios latentes, resultantes de dicho proceso. Por ello, nos permiten utilizar la versatilidad de las redes de aprendizaje profundo. Resultados.Para validar los resultados obtenidos se usaron las m´etricas de precisi´on, sensibilidad y aciertos. Los porcentajes de acierto obtenidos fueron elevados y cercanos a otros clasificadores que usan redes extremadamente complejas. Para el caso de la VF, se obtuvo un porcentaje de acierto (en un escenario multiclase) del 74.00%, resultado razonable que, por primera vez, nos permite observar la incidencia del m´etodo de bloqueo del sistema nervioso central no descrito en trabajos anteriores. Para la AF, el porcentaje de acierto (con un etiquetado bicl´asico para la detecci´on de presencia de la misma) alcanza el 94.50 %, lo cual se considera un resultado bueno si se recuerda que es una red de baja complejidad, y por tanto, que puede ser implementada en dispositivos de monitoreo y como una posible alerta para m´edicos especialistas. Para el caso de los micro-terremotos, el porcentaje de acierto fue 94.44% para el volc´an Llaima y 95.45% para el volc´an Cotopaxi, resultados muy pr´oximos a los proporcionados por redes muy complejas, si bien lo primordial de estos resultados es que se logr´o determinar la existencia de caracter´ısticas en com´un entre los volcanes, y en particular, dos caracter´ısticas tienen una presencia fuerte tanto para el volc´an Cotopaxi como el Llaima y son el Spectral Flux y el Spectral Rolloff Point. Con estas dos caracter´ısticas y su interpretaci´on f´ısica puede trazarse una analog´ıa entre los eventos presentes en micro terremotos y el procesamiento de voz en cuanto a la clasificaci´on de los sonidos en sonoros y no sonoros, y las implicaciones en cuanto a los modelos matem´aticos de s´ıntesis de la voz. Conclusiones. De los resultados obtenidos podemos concluir que las representaciones tiempo-frecuencia siguen siendo una herramienta vers´atil para empezar el an´alisis de cualquier tipo de se˜nal, desde los registros card´ıacos de fibrilaciones hasta los registros volc´anicos de micro terremotos. El kernel usado demostr´o versatilidad y el tama˜no ´optimo de ventana permiti´o comprobar que un espectro con m´as detalles o un espectro suavizado proporcionan, dentro de un rango, espacios latentes con propiedades similares. La clasificaci´on realizada por los autoencoders en registros de VF fue buena en comparaci ´on con trabajos anteriores, puesto que no solo alcanz´o prestaciones notables en la detecci´on de la mediaci´on de diferentes tipos de f´armacos, sino que adem´as pudo detectar el m´etodo de bloqueo del sistema nervioso central, gracias a las caracter´ısticas entregadas a la red en el espacio de entrada y proporcionadas por dicha red en el espacio latente de baja dimensionalidad. En el estudio de la AF, se utilizaron m´etodos de selecci´on de caracter´ısticas y redes de baja dimensionalidad. Se obtuvieron resultados positivos, comparables a otras propuestas en la literatura cient´ıfica que emplearon redes m´as complejas y un n´umero considerable de caracter´ısticas. En cuanto a la aplicaci´on en los micro terremotos, este es uno de los primeros trabajos que trata de establecer caracter´ısticas en com´un entre dos volcanes de la misma familia o clasificaci´on adem´as de conseguir buenos porcentajes de acierto en la clasificaci´on de los eventos. Una vez m´as, el escoger el m´etodo de reducci´on de caracter´ısticas potenci´o las prestaciones obtenidas y permiti´o determinar similitudes entre las caracter´ısticas. De manera general, podemos concluir que las caracter´ısticas utilizadas tienden a representar de buena manera los fen´omenos de las fibrilaciones card´ıacas y de los micro terremotos. Con los porcentajes de aciertos obtenidos, cercanos a trabajos con redes extremadamente complejas, dejamos una puerta abierta para investigar estructuras m´as simples que redunden en procesos r´apidos y f´aciles de interpretar.

Descripción

Tesis Doctoral leída en la Universidad Rey Juan Carlos de Madrid en 2024. Directores: Dr. Enrique Vinicio Carrera Erazo Dr. Francisco Manuel Melgarejo Meseguer Tutor: Dr. José Luis Rojo Álvarez

Citación

Colecciones

license logo
Excepto si se señala otra cosa, la licencia del ítem se describe como Attribution-NonCommercial-NoDerivatives 4.0 Internacional