PREDICCIÓN DE RESULTADOS DE FÚTBOL APLICANDO TÉCNICAS DE MACHINE LEARNING
Fecha
2024-06-28
Autores
Título de la revista
ISSN de la revista
Título del volumen
Editor
Universidad Rey Juan Carlos
Resumen
En el presente TFG abordaremos un proyecto de ciencia de datos, la predicción de resultados de fútbol utilizando técnicas de Machine Learning. Para ello vamos a obtener los datos de las cuatro grandes ligas europeas de fútbol de la temporada 2015-2016. La idea principal del proyecto será poder predecir la victoria o no victoria (empates y derrotas) del equipo local en partidos de esas cuatro ligas en dicha temporada, lo que se conoce, en términos de Machine Learning, como un clasificador binario. Este proyecto aplica técnicas de machine learning para predecir los resultados de los partidos de fútbol en un clasificador binario y utilizando estadísticas de los partidos y datos de los jugadores.
El TFG abarca todas las etapas de ciencia de datos, incluyendo la recolección de los datos de fuentes de datos, la limpieza de estos, la transformación y análisis de los mismos. Además, seleccionaremos las características más adecuadas del conjunto de datos que nos ayuden a predecir los resultados a través de cuatro modelos diferentes: regresión logística, random forest, XGBoost y SVC, para tratar de obtener unos resultados en términos de precisión por encima del simple azar. Se considerará el impacto de la selección de características utilizando el algoritmo BORUTA, y se compararán los resultados de los modelos con y sin este algoritmo.
Por último, evaluaremos estos resultados con diferentes técnicas sobre las predicciones, mostrando valiosas visualizaciones. Las conclusiones del proyecto revelan que todos los modelos superan el umbral de referencia del 55% de precisión, siendo la regresión logística el modelo más preciso y consistente en todas las ejecuciones, y la selección de características mejorando el rendimiento en la mayoría de los casos. El estudio concluye discutiendo las implicaciones de los resultados y proponiendo mejoras futuras para refinar estos modelos predictivos.
Utilizaremos para todo ello, el lenguaje de programación de Python, junto con una serie de librerías que serán detalladas en próximos apartados del presente documento, en un entorno de programación de notebooks de Jupyter para poder detallar con claridad cada paso del proceso.
Descripción
Trabajo Fin de Grado leído en la Universidad Rey Juan Carlos en el curso académico 2023/2024. Directores/as: Javier Gómez Miguel
Palabras clave
Citación
Colecciones
Excepto si se señala otra cosa, la licencia del ítem se describe como