GENERACIÓN DE GRAFOS DE CONOCIMIENTO A TRAVÉS DE CONVERSACIONES EN TWITTER
Fecha
2023-07-19
Autores
Título de la revista
ISSN de la revista
Título del volumen
Editor
Universidad Rey Juan Carlos
Resumen
Este Trabajo de Fin de Grado (TFG) está impulsado por la motivación de adquirir un mayor conocimiento del mundo que nos rodea, entendiendo así los problemas que afectan a la sociedad y las soluciones que se pueden llevar a cabo. Para ello, es necesario tener una base sobre los Objetivos de Desarrollo Sostenible, el análisis de redes sociales y Topic Modeling.
Por ende, este TFG tiene como propósito la aplicación de técnicas de Deep Learning y Procesamiento del Lenguaje Natural (PLN) para la clasificación de textos de la red social de Twitter. Concretamente, se analizan tweets que tratan sobre el tema de Objetivos de Desarrollo Sostenible (SDGs). Esta Agenda Global consta de 17 objetivos, que fueron creados por las Naciones Unidas en 2015, como continuación de los Objetivos de Desarrollo del Milenio (ODM). Todos ellos diseñados para acabar con problemas universales como la pobreza, la desigualdad, el hambre, la contaminación, etc.
Por otro lado, los objetivos principales de este TFG son comprender el funcionamiento de la API de Tweepy para extraer toda la información relevante sobre los SDGs, obtener la conexión que tienen entre sí los SDGs y así determinar relaciones que no se ven a simple vista o ver cómo influye un SDG sobre otro, y, por último, descubrir los temas de los que se tratan dentro de los SDGs para ver qué conversaciones surgen en este extenso tema.
Continuando con lo expuesto anteriormente, para lograr estos objetivos se divide el proceso en dos bloques. El primero consta de la descarga de tweets, los cuales son la información con la que se trabaja a lo largo del TFG. Asimismo, el segundo bloque consta de aplicar técnicas de PLN a estos tweets para obtener el grafo y varias gráficas que aportan una mayor información, las cuales se consiguen gracias a Topic Modeling.
De esta manera, resultan necesarias distintas herramientas para su desarrollo. La base de datos para el almacenamiento de los tweets en formato JSON es MongoDB. Como lenguaje de programación se utiliza Python, el cual es un lenguaje de alto nivel. Para el control de versiones se usa GitHub, un repositorio online. Y, en último lugar, una serie de módulos de interés mencionados y descritos a lo largo de esta memoria.
Finalmente, se resume todo el proceso en una consecución de objetivos donde se pone en valor los logros alcanzados. Como consecuencia, se puede llevar a cabo un análisis de los conocimientos utilizados que se han adquirido a lo largo de la carrera frente a los conocimientos nuevos aprendidos en el desarrollo de este TFG. Por lo que, con todos estos elementos, se puede crear un análisis que determina potenciales mejoras que pueden ser implementadas en el futuro.
Descripción
Trabajo Fin de Grado leído en la Universidad Rey Juan Carlos en el curso académico 2022/2023. Directores/as: David Roldán Álvarez
Palabras clave
Citación
Colecciones
Excepto si se señala otra cosa, la licencia del ítem se describe como