SOFTWARE DE DETECCIÓN DE PHISING EN URJLS MEDIANTE LA APLICACIÓN DE DIVERSOS ALGORITMOS DE CLASIFICACIÓN

Resumen

Este proyecto se centra en el desarrollo de un software destinado para el an¿alisis de URLs implementando diversas t¿ecnicas de clasificaci¿on y determinar si estas son leg¿¿timas o no. El objetivo principal es desarrollar e investigar el m¿etodo m¿as eficaz para distinguir entre URLs maliciosas y leg¿¿timas, adem¿as de comprender c¿omo la inteligencia artificial puede aplicarse en el ¿ambito de la ciberseguridad para proteger a los usuarios de ataques de phishing. El objetivo de esta iniciativa es elaborar una soluci¿on adaptativa y robusta para detectar este tipo de ataques. Durante el desarrollo del proyecto, se han implementado y evaluado diversos algoritmos de aprendizaje autom¿atico, como el XGB Classifier, la Regresi¿on Log¿¿stica y el Gradient Boosting, para determinar cu¿al ofrece la mejor capacidad predictiva. Estos modelos fueron entrenados utilizando conjuntos de datos que incluyen tanto URLs leg¿¿timas como maliciosas, lo que permiti¿o un an¿alisis detallado de caracter¿¿sticas espec¿¿ficas de las URLs. El c¿odigo desarrollado para este proyecto incluye scripts que extraen autom¿aticamente las caracter¿¿sticas necesarias de cada URL para que la red neuronal pueda procesarlas. Estas caracter¿¿sticas abarcan desde la longitud de la URL hasta la presencia de elementos sospechosos, como el uso de IPs en lugar de nombres de dominio y la existencia de m¿ultiples redirecciones. El c¿odigo se dise¿n¿o para ser eficiente y escalable, permitiendo su integraci¿on con diferentes bases de datos de URLs y facilitando la actualizaci¿on y mejora continua del modelo.

Descripción

Trabajo Fin de Grado leído en la Universidad Rey Juan Carlos en el curso académico 2023/2024. Directores/as: David Concha Gómez, Francisco José García Espinosa

Citación