SOFTWARE DE DETECCIÓN DE PHISING EN URJLS MEDIANTE LA APLICACIÓN DE DIVERSOS ALGORITMOS DE CLASIFICACIÓN
Fecha
2024-07-15
Título de la revista
ISSN de la revista
Título del volumen
Editor
Universidad Rey Juan Carlos
Resumen
Este proyecto se centra en el desarrollo de un software destinado para el
an¿alisis de URLs implementando diversas t¿ecnicas de clasificaci¿on y determinar
si estas son leg¿¿timas o no. El objetivo principal es desarrollar e investigar el
m¿etodo m¿as eficaz para distinguir entre URLs maliciosas y leg¿¿timas, adem¿as
de comprender c¿omo la inteligencia artificial puede aplicarse en el ¿ambito de la
ciberseguridad para proteger a los usuarios de ataques de phishing. El objetivo
de esta iniciativa es elaborar una soluci¿on adaptativa y robusta para detectar este
tipo de ataques.
Durante el desarrollo del proyecto, se han implementado y evaluado diversos algoritmos de aprendizaje autom¿atico, como el XGB Classifier, la Regresi¿on
Log¿¿stica y el Gradient Boosting, para determinar cu¿al ofrece la mejor capacidad predictiva. Estos modelos fueron entrenados utilizando conjuntos de datos
que incluyen tanto URLs leg¿¿timas como maliciosas, lo que permiti¿o un an¿alisis
detallado de caracter¿¿sticas espec¿¿ficas de las URLs.
El c¿odigo desarrollado para este proyecto incluye scripts que extraen autom¿aticamente las caracter¿¿sticas necesarias de cada URL para que la red neuronal pueda
procesarlas. Estas caracter¿¿sticas abarcan desde la longitud de la URL hasta la
presencia de elementos sospechosos, como el uso de IPs en lugar de nombres de
dominio y la existencia de m¿ultiples redirecciones. El c¿odigo se dise¿n¿o para ser
eficiente y escalable, permitiendo su integraci¿on con diferentes bases de datos de
URLs y facilitando la actualizaci¿on y mejora continua del modelo.
Descripción
Trabajo Fin de Grado leído en la Universidad Rey Juan Carlos en el curso académico 2023/2024. Directores/as: David Concha Gómez, Francisco José García Espinosa