INTRODUCCIÓN AL PROCESAMIENTO DE LENGUAJE: UN ESTUDIO EXPERIMENTAL SOBRE LA DETECCIÓN DE DISCURSO DE ODIO EN REDES SOCIALES
Fecha
2024-06-28
Autores
Título de la revista
ISSN de la revista
Título del volumen
Editor
Universidad Rey Juan Carlos
Enlace externo
Resumen
La detección de discurso de odio es crucial en la actualidad debido al creciente uso de redes sociales, donde el anonimato y el alcance global han facilitado la proliferación de comentarios discriminatorios y abusivos. La problemática identificada orienta este Trabajo de Fin de Grado al estudio y aplicación de modelos de redes neuronales avanzados y procesamiento de lenguaje natural para la clasificación de comentarios en redes sociales atendiendo a su toxicidad.
En la primera parte del trabajo, se pretende proporcionar una base sólida de conceptos sobre aprendizaje automático, modelos de redes neuronales y técnicas de representación vectorial de texto.
Posteriormente, se lleva a cabo un estudio experimental, cuyo objetivo principal es evaluar la efectividad de técnicas de aprendizaje por conjuntos como votación (voting) y apilamiento (stacking) en la mejora del rendimiento de los modelos de redes neuronales. Para ello, se implementan y comparan varios modelos de clasificación binaria de texto utilizando distintos conjuntos de datos tanto para el entrenamiento como para la prueba.
Además de alcanzar el objetivo central del estudio, se extraen otras conclusiones como la importancia de la calidad y diversidad de los conjuntos de datos, la necesidad de abordar el desbalance de clases para optimizar el rendimiento de los modelos o la efectividad de técnicas de ensemble en mejorar las predicciones incluso de modelos avanzados, tales como BERT, que han sido ajustados a la tarea específica del estudio.
Descripción
Trabajo Fin de Grado leído en la Universidad Rey Juan Carlos en el curso académico 2023/2024. Directores/as: César Alfaro Gimeno