Extracción supervisada de relaciones entre conceptos a partir de texto libre en español o en inglés
Abstract
La gran cantidad de información existente hace imprescindible contar con herramientas capaces de procesar datos textuales y facilitar la comunicación entre las personas y los ordenadores. Herramientas que se ocupen de la extracción, recuperación, clasificación y traducción de la información disponible. De todos los niveles de procesamiento del lenguaje natural, este proyecto se centra en el morfo-semántico, en el sentido que se extraen las relaciones entre conceptos para poder evaluar correctamente respuestas. Entendiendo como conceptos, palabras claves y las relaciones como la información que une dos conceptos. En concreto, para este trabajo se ha desarrollado Zilan, cuyo objetivo principal es el desarrollo de un sistema web para la extracción supervisada de relaciones entre conceptos, a partir de texto libre en inglés o en español. Permitiendo, además, al usuario insertar, modificar o eliminar relaciones y conceptos, clasificar las relaciones y mostrando los resultados de una forma clara mediante una taxonomía y un gráfico. Este trabajo parte de una aplicación educativa, Willow, pero se ha construido de manera independiente, de forma que pueda ser utilizada por personas de otros ámbitos, como lingüistas que estudian el texto o por investigadores del Procesamiento del Lenguaje Natural. Para hacer posible el proyecto y cumplir con las condiciones, se han utilizado herramientas como Java, MySQL, Windows, Tomcat y Graphviz. Mientras la metodología empleada para el desarrollo del proyecto ha sido el Proceso Unificado, de forma que se ha añadido funcionalidad al sistema de manera progresiva y centrándose en el usuario. Esto se ha realizado en cinco fases diferentes: obtención de los requisitos, análisis, diseño, implementación y pruebas. En la fase final, se han realizaron diferentes tipos de pruebas, para validar el correcto funcionamiento de la aplicación desarrollada, para verificar si cumple con los requisitos, para comprobar la integración de todos los módulos y para averiguar la aceptación entre usuarios tanto informáticos como no informáticos.
Description
Proyecto Fin de Carrera leído en la Universidad Rey Juan Carlos en el curso académico 2011/2012. Tutor del Proyecto: Diana Pérez
Collections
- Proyectos Fin de Carrera [439]