TIME-FREQUENCY ANALYSIS, AUDIO-BASED FEATURES, AND LOW-DIMENSIONAL MANIFOLD LATENT SPACES IN CARDIAC AND SEISMOGRAPHIC SIGNALS
Fecha
2024
Autores
Título de la revista
ISSN de la revista
Título del volumen
Editor
Universidad Rey Juan Carlos
Resumen
Antecendentes. En los ´ultimos a˜nos, el avance experimentado por los dispositivos de
c´omputo junto con el desarrollo de los algoritmos de inteligencia artificial ha permito
suministrar gran cantidad de informaci´on para entrenar a las redes. En este sentido
el an´alisis tiempo frecuencia provee de una mayor cantidad de rasgos o caracter´ısticas
para determinados fen´omenos naturales que el tradicional an´alisis en tiempo y amplitud.
Siguiendo esta misma ruta, el procesamiento digital de voz y audio, conocido como an´alisis
del contenido de audio, explora el uso de escalas psicoac´usticas y la divisi´on en bandas
cr´ıticas y adiciona un n´umero considerable de caracter´ısticas para el an´alisis de fen´omenos
naturales aumentando la cantidad de informaci´on a ser analizada y procesada. Existe la
tendencia de usar redes extremadamente complejas para solucionar todo tipo de problemas,
por lo que exploramos las representaciones de baja dimensionalidad mediante Manifold
Learning con la idea de reducir esta complejidad, que las redes sean de f´acil interpretaci´on
y que a futuro puedan llegar a ser implementadas en dispositivos de bajo costo.
En primer lugar, partimos de bases de datos que contienen registros de electrocardiograma
(ECG), la primera de ellas contiene fibrilaci´on ventricular (VF, del ingl´es Ventricular
Fibrillation), afecci´on card´ıaca conocida por lo letal y dif´ıcil de estudiar, dado que su
aparici´on conlleva a la muerte del paciente si no se aplica, en unos pocos minutos, un
protocolo de reanimaci´on mediante electroshock. Esta base contiene un n´umero limitado de
pacientes, pero sus registros son extensos. La segunda base contiene registros de fibrilaci´on
auricular (AF, del ingl´es Atrial Fibrillation) condici´on card´ıaca cada vez m´as presente
en la poblaci´on mundial ocasionando deterioro en la calidad de vida en el paciente y el
aumento de los gastos en salud de los pa´ıses. Dados buenos los resultados obtenidos con las
primeras se˜nales de fibrilaci´on, se opt´o por extender el trabajo hacia la vulcanolog´ıa con la
intenci´on de la detecci´on de eventos. Es por eso que la ´ultima base contiene registros de
micro terremotos producidos por los volcanes Cotopaxi y Llaima. Al contrario de la base
de datos de VF, aqu´ı se cuenta con un gran n´umero de registros. Los micro terremotos
producidos por los volcanes son usados para intentar predecir una eventual erupci´on porque
son menos peligrosos para los vulcan´ologos, ya que no requieren de trabajo en campo,
y por ello se ha pretendido mejorar las herramientas que usan los vulcan´ologos a trav´es
de las caracter´ısticas encontradas por los m´etodos aqu´ı propuestos. Es sabido que dichas
predicciones apuntan a sistemas de alerta temprana para minimizar los da˜nos por una
posible erupci´on. El uso de bases de datos de dos volcanes permite aumentar el n´umero de
eventos para que las redes sean m´as generales, con la premisa que los dos volcanes son del
tipo estratovolc´an, y determinar caracter´ısticas en com´un.
Objetivos. Utilizado el an´alisis tiempo frecuencia, se pretende sacar el m´aximo provecho
al variar los kernels (funci´on de distribuci´on o se˜nal), el tipo de ventana y el tama˜no
que mejor represente el fen´omeno de la fibrilaci´on. El objetivo con los registros de VFes observar su evoluci´on a lo largo del tiempo verificar si existen diferencias visibles y el
efecto producido por los f´armacos para contrarrestar su aparici´on y, si es posible, clasificar
empleando autoencoders y redes de baja dimensionalidad, de acuerdo con cada uno de
estos f´armacos. Con la base que contiene registros de AF se pretende detectar dicha
arrtimia, empleando la reducci´on de caracter´ısticas y redes de baja dimensionalidad. Como
´ultimo objetivo, se propone emplear todas las herramientas usadas en las fibrilaciones para
clasificar los eventos presentes en los micro terremotos y encontrar caracter´ısticas nuevas y
a la vez similares en los dos volcanes.
Metodolog´ıa. Este tipo de se˜nales comparten el ser generadas por sistemas muy din´amicos
aleatorios, adem´as de estar inmersos en ruido dada la forma de la captaci´on de las se˜nales.
Por ello ha sido necesario un preprocesamiento para retirar ruido y otros tipos de anomal´ıa
debidos a la toma de datos de acuerdo con cada una de los conjuntos de datos. Se debe
mencionar que los anchos de banda de los fen´omenos se encuentran en pocos hercios, por
lo que el uso de estas caracter´ısticas resulta id´oneo para entender su din´amica y buscar
una forma razonable de clasificar sus eventos.
Con cada una de las bases de datos y la informaci´on obtenida de las caracter´ısticas
extra´ıdas para cada una de ellas, se probaron varias configuraciones con la intensi´on
de encontrar el mejor rendimiento. Los autoencoders con su estructura de codificador y
decodificar fueron las escogidos para la clasificaci´on, dado que su estructura permite reducir
el espacio de entrada en variables latentes de baja dimensionalidad en los que abordar
la interpretaci´on. Los m´etodos de reducci´on caracter´ısticas de este tipo producen en el
espacio latente agrupaciones locales de los vectores de entrada mapeados, conocidos como
manifolds, que permiten una observaci´on subjetiva y objetiva de gr´aficas tridimensionales
de los distintos grupos observables obtenidos en dichos espacios latentes, resultantes de
dicho proceso. Por ello, nos permiten utilizar la versatilidad de las redes de aprendizaje
profundo.
Resultados.Para validar los resultados obtenidos se usaron las m´etricas de precisi´on,
sensibilidad y aciertos. Los porcentajes de acierto obtenidos fueron elevados y cercanos
a otros clasificadores que usan redes extremadamente complejas. Para el caso de la VF,
se obtuvo un porcentaje de acierto (en un escenario multiclase) del 74.00%, resultado
razonable que, por primera vez, nos permite observar la incidencia del m´etodo de bloqueo
del sistema nervioso central no descrito en trabajos anteriores. Para la AF, el porcentaje
de acierto (con un etiquetado bicl´asico para la detecci´on de presencia de la misma) alcanza
el 94.50 %, lo cual se considera un resultado bueno si se recuerda que es una red de baja
complejidad, y por tanto, que puede ser implementada en dispositivos de monitoreo y
como una posible alerta para m´edicos especialistas. Para el caso de los micro-terremotos,
el porcentaje de acierto fue 94.44% para el volc´an Llaima y 95.45% para el volc´an
Cotopaxi, resultados muy pr´oximos a los proporcionados por redes muy complejas, si bien
lo primordial de estos resultados es que se logr´o determinar la existencia de caracter´ısticas
en com´un entre los volcanes, y en particular, dos caracter´ısticas tienen una presencia fuerte
tanto para el volc´an Cotopaxi como el Llaima y son el Spectral Flux y el Spectral Rolloff
Point. Con estas dos caracter´ısticas y su interpretaci´on f´ısica puede trazarse una analog´ıa
entre los eventos presentes en micro terremotos y el procesamiento de voz en cuanto a la
clasificaci´on de los sonidos en sonoros y no sonoros, y las implicaciones en cuanto a los
modelos matem´aticos de s´ıntesis de la voz.
Conclusiones. De los resultados obtenidos podemos concluir que las representaciones tiempo-frecuencia siguen siendo una herramienta vers´atil para empezar el an´alisis de
cualquier tipo de se˜nal, desde los registros card´ıacos de fibrilaciones hasta los registros
volc´anicos de micro terremotos. El kernel usado demostr´o versatilidad y el tama˜no ´optimo
de ventana permiti´o comprobar que un espectro con m´as detalles o un espectro suavizado
proporcionan, dentro de un rango, espacios latentes con propiedades similares.
La clasificaci´on realizada por los autoencoders en registros de VF fue buena en comparaci
´on con trabajos anteriores, puesto que no solo alcanz´o prestaciones notables en la
detecci´on de la mediaci´on de diferentes tipos de f´armacos, sino que adem´as pudo detectar
el m´etodo de bloqueo del sistema nervioso central, gracias a las caracter´ısticas entregadas
a la red en el espacio de entrada y proporcionadas por dicha red en el espacio latente de
baja dimensionalidad.
En el estudio de la AF, se utilizaron m´etodos de selecci´on de caracter´ısticas y redes de
baja dimensionalidad. Se obtuvieron resultados positivos, comparables a otras propuestas
en la literatura cient´ıfica que emplearon redes m´as complejas y un n´umero considerable de
caracter´ısticas.
En cuanto a la aplicaci´on en los micro terremotos, este es uno de los primeros trabajos
que trata de establecer caracter´ısticas en com´un entre dos volcanes de la misma familia o
clasificaci´on adem´as de conseguir buenos porcentajes de acierto en la clasificaci´on de los
eventos. Una vez m´as, el escoger el m´etodo de reducci´on de caracter´ısticas potenci´o las
prestaciones obtenidas y permiti´o determinar similitudes entre las caracter´ısticas.
De manera general, podemos concluir que las caracter´ısticas utilizadas tienden a
representar de buena manera los fen´omenos de las fibrilaciones card´ıacas y de los micro
terremotos. Con los porcentajes de aciertos obtenidos, cercanos a trabajos con redes
extremadamente complejas, dejamos una puerta abierta para investigar estructuras m´as
simples que redunden en procesos r´apidos y f´aciles de interpretar.
Descripción
Tesis Doctoral leída en la Universidad Rey Juan Carlos de Madrid en 2024. Directores:
Dr. Enrique Vinicio Carrera Erazo
Dr. Francisco Manuel Melgarejo Meseguer
Tutor:
Dr. José Luis Rojo Álvarez
Palabras clave
Citación
Colecciones
Excepto si se señala otra cosa, la licencia del ítem se describe como Attribution-NonCommercial-NoDerivatives 4.0 Internacional