Estudio de clasificadores basado en métodos de aprendizaje máquina para la detección de eventos de niebla en la autovía A8
Archivos
Fecha
2022
Autores
Título de la revista
ISSN de la revista
Título del volumen
Editor
Universidad Rey Juan Carlos
Resumen
En el presente proyecto se van a diseñar una serie de clasificadores capaces de predecir eventos
de visibilidad a partir de una base de datos real de 2018 y 2019, centrada en torno a la autovía
A-8 a su paso por el municipio de Mondoñedo.
A partir de esta obtenemos los valores de visibilidad en tres sensores meteorológicos en nuestra
área de estudio. Después de ello accedemos a la página web del Centro Europeo de Previsiones
Meteorológicas a Plazo Medio (European Centre for Medium-Range Weather Forecasts,
ECMWF) para descargar los datos de una serie de variables meteorológicas para nuestra área
de estudio. Sin embargo, al estudiar nuestros datos descargados en Panoply 5.0.0, observamos
que obtenemos mediciones meteorológicas para cada hora, frente a los cinco minutos de la
visibilidad. Para solucionar esto realizaremos en Matlab R2021B promedios de visibilidad para
obtener mediciones horarias también. Una vez obtenemos los datos, realizamos una tabla para
cada sensor con las variables meteorológicas y su valor de visibilidad asociado. A continuación,
establecemos unos filtros de visibilidad para obtener el tipo de niebla asociada a esta y pasamos
nuestros datos por ellos, añadiendo los resultados a las tablas.
Una vez tenemos las tablas, dividimos los datos en un 80% para entrenamiento y un 20% para
pruebas. Los datos de pruebas los reservamos para usar los mismos en todos los experimentos.
En cuanto a los de entrenamiento, al estar los datos desbalanceados, usaremos las técnicas de
sobremuestreo y submuestreo para obtener el mismo número de muestras de cada evento de
visibilidad. Tras obtener los datos de entrenamiento, los usamos como entradas para generar
y entrenar nuestros distintos tipos de clasificadores. Después de ello pasamos nuestros datos
de prueba para que predigan los eventos de niebla y los comparamos con las salidas reales. A
partir de estas comparaciones obtenemos las diferentes métricas de salida para estudiar y evaluar
nuestros clasificadores.
Obtenemos que el mejor para predecir los tres eventos mediante las dos técnicas de balanceo
es el Bagged Trees, seguido por el Wide NN y el Fine Gaussian SVM con resultados parejos
entre sí y destacando por su resistencia al menor número de muestras, el Fine KNN con unos
resultados algo peores y, por último, el Fine Tree con los peores resultados de este grupo.
Descripción
Trabajo Fin de Grado leído en la Universidad Rey Juan Carlos en el curso académico 2021/2022. Tutor: David Casillas Pérez
Cotutora: Laura Cornejo Bueno
Palabras clave
Citación
Colecciones
Excepto si se señala otra cosa, la licencia del ítem se describe como Attribution-NonCommercial-NoDerivatives 4.0 Internacional