Clasificación Automática Multiclase de Tweets y su Representación Gráfica

Hernández Pajares, Beatriz

Clasificación Automática Multiclase de Tweets y su Representación Gráfica

dc.contributor.author	Hernández Pajares, Beatriz
dc.date.accessioned	2013-12-16T14:52:57Z
dc.date.available	2013-12-16T14:52:57Z
dc.date.issued	2013-12-16
dc.description	Trabajo Fin de Máster	es
dc.description.abstract	Las redes sociales han protagonizado un importante auge en los últimos años, lo que genera grandes cantidades de información difíciles de procesar de forma manual. Al mismo tiempo, se ha podido avanzar en áreas como Procesamiento de Lenguaje Natural (PLN), análisis y visualización de datos que han permitido un procesamiento cada vez más automático y ventajoso para los fines que se quieran conseguir a partir del gran volumen de datos que se puede recopilar. En particular, en este trabajo, a partir de una iniciativa conjunta de Telefónica I+D y la Universidad Rey Juan Carlos, se investiga la posibilidad de la identificación y clasificación automática multi-clase de temáticas de quejas registradas automáticamente en tweets, y el posterior desarrollo de una Interfaz de Usuario que permita visualizar los temas identificados de forma geo-localizada. Para conseguir este objetivo, se combinan conocimientos y técnicas de áreas como PLN estadístico para el pre-procesado de los tweets, clasificadores supervisados, y técnicas de visualización. El proyecto consta de dos partes diferenciadas: por un lado, el proceso de identificación y clasificación de las quejas para el que se entrenan dos clasificadores multi-clase: SVM con diferentes funciones kernel y el método multi-clase one-versus-one, y Random Forests. Tras realizar un análisis de resultados para cada uno de ellos se determina como método para clasificar las quejas Random Forests con una precisión media del 81.46% y una cobertura media del 59.88%. Por otro lado, la visualización de las quejas clasificadas para la que se desarrolla una Interfaz de Usuario que permite al usuario visualizar las diferentes quejas de forma dinámica en Google Maps mediante un mapa de calor en 2D y en Google Earth descargando el fichero que contiene una representación de las quejas mediante barras con diferentes alturas en 3D. Se pidió a ocho usuarios de edades comprendidas entre 23 y 40 años que interactuasen con la interfaz desarrollada y completasen un cuestionario de satisfacción. Los resultados obtenidos muestran que el 87.5% de los usuarios creen que la clasificación y visualización de los datos es una buena idea, que se ha conseguido con el desarrollo de este proyecto, y que la interfaz es sencilla de utilizar. El 100% de los usuarios considera que la visualización representa con claridad los datos que se quieren mostrar aunque uno de los usuarios opina que podría mejorar y el 87.5% cree que la información representada puede resultar de utilidad a los organismos implicados en la misma.	es
dc.description.departamento	Lenguajes y Sistemas Informáticos I
dc.identifier.uri	http://hdl.handle.net/10115/11914
dc.language.iso	spa	es
dc.rights.accessRights	info:eu-repo/semantics/openAccess	es
dc.subject	clasificación automática	es
dc.subject	redes sociales	es
dc.subject	Twitter	es
dc.subject	visualización	es
dc.subject	Informática	es
dc.subject.unesco	3325 Tecnología de las Telecomunicaciones	es
dc.title	Clasificación Automática Multiclase de Tweets y su Representación Gráfica	es
dc.type	info:eu-repo/semantics/masterThesis	es

Archivos

Bloque original

Mostrando 1 - 1 de 1

Nombre:: MEMORIA TFM.pdf
Tamaño:: 4.12 MB
Formato:: Adobe Portable Document Format

Descargar

Colecciones

Trabajos Fin de Máster