Estudio de clasificadores basado en métodos de aprendizaje máquina para la detección de eventos de niebla en la autovía A8

Fecha

2022

Título de la revista

ISSN de la revista

Título del volumen

Editor

Universidad Rey Juan Carlos

Resumen

En el presente proyecto se van a diseñar una serie de clasificadores capaces de predecir eventos de visibilidad a partir de una base de datos real de 2018 y 2019, centrada en torno a la autovía A-8 a su paso por el municipio de Mondoñedo. A partir de esta obtenemos los valores de visibilidad en tres sensores meteorológicos en nuestra área de estudio. Después de ello accedemos a la página web del Centro Europeo de Previsiones Meteorológicas a Plazo Medio (European Centre for Medium-Range Weather Forecasts, ECMWF) para descargar los datos de una serie de variables meteorológicas para nuestra área de estudio. Sin embargo, al estudiar nuestros datos descargados en Panoply 5.0.0, observamos que obtenemos mediciones meteorológicas para cada hora, frente a los cinco minutos de la visibilidad. Para solucionar esto realizaremos en Matlab R2021B promedios de visibilidad para obtener mediciones horarias también. Una vez obtenemos los datos, realizamos una tabla para cada sensor con las variables meteorológicas y su valor de visibilidad asociado. A continuación, establecemos unos filtros de visibilidad para obtener el tipo de niebla asociada a esta y pasamos nuestros datos por ellos, añadiendo los resultados a las tablas. Una vez tenemos las tablas, dividimos los datos en un 80% para entrenamiento y un 20% para pruebas. Los datos de pruebas los reservamos para usar los mismos en todos los experimentos. En cuanto a los de entrenamiento, al estar los datos desbalanceados, usaremos las técnicas de sobremuestreo y submuestreo para obtener el mismo número de muestras de cada evento de visibilidad. Tras obtener los datos de entrenamiento, los usamos como entradas para generar y entrenar nuestros distintos tipos de clasificadores. Después de ello pasamos nuestros datos de prueba para que predigan los eventos de niebla y los comparamos con las salidas reales. A partir de estas comparaciones obtenemos las diferentes métricas de salida para estudiar y evaluar nuestros clasificadores. Obtenemos que el mejor para predecir los tres eventos mediante las dos técnicas de balanceo es el Bagged Trees, seguido por el Wide NN y el Fine Gaussian SVM con resultados parejos entre sí y destacando por su resistencia al menor número de muestras, el Fine KNN con unos resultados algo peores y, por último, el Fine Tree con los peores resultados de este grupo.

Descripción

Trabajo Fin de Grado leído en la Universidad Rey Juan Carlos en el curso académico 2021/2022. Tutor: David Casillas Pérez Cotutora: Laura Cornejo Bueno

Palabras clave

Citación

license logo
Excepto si se señala otra cosa, la licencia del ítem se describe como Attribution-NonCommercial-NoDerivatives 4.0 Internacional