Inferencia de grafos mediante un modelo SEM en presencia de nodos ocultos

Fecha

2024

Título de la revista

ISSN de la revista

Título del volumen

Editor

Universidad Rey Juan Carlos

Resumen

El objetivo del presente Trabajo de Fin de Grado (TFG) es abordar el problema de la inferencia de topología en grafos en presencia de nodos ocultos, utilizando para ello el modelo de ecuaciones estructurales (SEM). La inferencia de topología es fundamental para comprender la estructura subyacente de redes complejas, donde las conexiones entre nodos no siempre son observables directamente. Este problema es de especial relevancia en diversas áreas como la biología (donde se busca identificar interacciones genéticas o moleculares ocultas), las telecomunicaciones (para modelar redes con usuarios o nodos no directamente accesibles) o el análisis de redes sociales (al intentar descubrir relaciones indirectas que afectan al comportamiento global de la red). El trabajo incluye el desarrollo de un nuevo esquema de inferencia de grafos basado en el modelo SEM, que tiene en cuenta la presencia de nodos ocultos. El esquema se formula como un problema de optimización en el que se tiene acceso a un conjunto de señales asociadas a los nodos observados. La variable a optimizar es el grafo de interés y el objetivo a optimizar combina la fidelidad de las señales al modelo SEM con regularizadores que fomentan propiedades estructurales relacionadas con el grafo y con las variables ocultas. El uso de estos regularizadores (que incluyen la norma `1, la norma nuclear y la norma `2;1) es un elemento clave, ya que la presencia de nodos ocultos incrementa considerablemente los grados de libertad del problema y dificulta la inferencia de la topología del grafo. Un segundo aspecto crítico del esquema propuesto es que el problema formulado es convexo, lo que permite resolverlo con una complejidad computacional polinómica. El esquema de inferencia propuesto en el TFG se compara con un esquema base ya existente, que considera el modelo SEM pero no la existencia de nodos ocultos. Este análisis utiliza datos sintéticos, lo que permite explorar una variedad de escenarios, incluyendo grafos ponderados y no ponderados, que presentan dinámicas y desafíos específicos. Los resultados numéricos demuestran la utilidad del esquema propuesto y el considerable impacto que la presencia de variables ocultas tiene la inferencia de la topología. Asimismo, el análisis de sensibilidad realizado revela la influencia de diversos factores sobre el desempeño de los algoritmos, destacando la importancia del número de muestras disponibles, los valores de los hiperparámetros seleccionados y las características del grafo (ponderación, conectividad y simetría). Estos hallazgos no solo subrayan las limitaciones de los modelos actuales, sino que también resaltan el impacto que tienen las configuraciones iniciales y la selección de parámetros en el éxito de la inferencia topológica. El TFG se cierra con una serie de líneas futuras que subrayan la necesidad de seguir perfeccionando los métodos actuales para hacerlos más precisos y resilientes, así como la conveniencia de probarlos en un conjunto mayor de escenarios, incluyendo aplicaciones con datos reales.

Descripción

Trabajo Fin de Grado leído en la Universidad Rey Juan Carlos en el curso académico 2024/2025. Tutor: Prof. Dr. Samuel Rey Escudero Co-tutor: Prof. Dr. Antonio García Marqués

Citación

license logo
Excepto si se señala otra cosa, la licencia del ítem se describe como Attribution 4.0 International