Sistema de identificación y clasificación de entidades nombradas basado en lingpipe
Abstract
El presente Proyecto de Fin de Carrera supone el colofón a los estudios de Ingeniería Técnica Informática de Sistemas, y tiene como objetivo el enfrentar al alumno con un sistema informático completo, como es el desarrollo de una aplicación informática. Desde el nacimiento de la Inteligencia Artificial, se hizo necesaria una disciplina que investigara mecanismos eficaces computacionalmente para la comunicación entre personas y máquinas por medio de lenguajes naturales, y de esa idea surgió lo que hoy se conoce como Procesamiento del Lenguaje Natural. Este Proyecto de Fin de Carrera se enmarca dentro del área del Procesamiento del Lenguaje Natural y, en concreto, aborda el estudio de una tarea muy importante dentro de _este, como es el Reconocimiento de Entidades Nombradas. En particular, esta rama del Procesamiento del Lenguaje Natural se encarga de identificar y clasificar elementos en un texto (denominados Entidades Nombradas) que se encuadren dentro de categorías predefinidas, como por ejemplo personas, organizaciones o lugares. Para ello, en este Proyecto de Fin de Carrera se ha optado por extender la herramienta LingPipe (una librería Java para el reconocimiento de Entidades Nombradas), añadiendo determinadas heurísticas que mejoren los resultados de dicha herramienta. También se han incorporado nuevos idiomas a la misma mediante la creación manual de dos modelos para francés e italiano. El resultado es una aplicación capaz de identificar y clasificar Entidades Nombradas para inglés, castellano, francés e italiano. Además, se ha utilizado una API basada en Wikipedia para realizar traducciones automáticas de un idioma origen a otro destino.
Description
Proyecto Fin de Carrera leído en la Universidad Rey Juan Carlos en el curso académico 2010/2011. Tutores del Proyecto: Soto Montalvo Herranz y Eduardo García Pardo
Collections
- Proyectos Fin de Carrera [439]