Sistema de identificación y clasificación de entidades nombradas basado en lingpipe
Fecha
2010
Autores
Título de la revista
ISSN de la revista
Título del volumen
Editor
Universidad Rey Juan Carlos
Resumen
El presente Proyecto de Fin de Carrera supone el colofón a los estudios de Ingeniería
Técnica Informática de Sistemas, y tiene como objetivo el enfrentar al alumno con un
sistema informático completo, como es el desarrollo de una aplicación informática.
Desde el nacimiento de la Inteligencia Artificial, se hizo necesaria una disciplina que
investigara mecanismos eficaces computacionalmente para la comunicación entre personas
y máquinas por medio de lenguajes naturales, y de esa idea surgió lo que hoy se conoce
como Procesamiento del Lenguaje Natural.
Este Proyecto de Fin de Carrera se enmarca dentro del área del Procesamiento del
Lenguaje Natural y, en concreto, aborda el estudio de una tarea muy importante dentro
de _este, como es el Reconocimiento de Entidades Nombradas. En particular, esta rama
del Procesamiento del Lenguaje Natural se encarga de identificar y clasificar elementos
en un texto (denominados Entidades Nombradas) que se encuadren dentro de categorías
predefinidas, como por ejemplo personas, organizaciones o lugares.
Para ello, en este Proyecto de Fin de Carrera se ha optado por extender la herramienta
LingPipe (una librería Java para el reconocimiento de Entidades Nombradas), añadiendo
determinadas heurísticas que mejoren los resultados de dicha herramienta. También se
han incorporado nuevos idiomas a la misma mediante la creación manual de dos modelos
para francés e italiano. El resultado es una aplicación capaz de identificar y clasificar
Entidades Nombradas para inglés, castellano, francés e italiano. Además, se ha utilizado
una API basada en Wikipedia para realizar traducciones automáticas de un idioma origen
a otro destino.
Descripción
Proyecto Fin de Carrera leído en la Universidad Rey Juan Carlos en el curso académico 2010/2011. Tutores del Proyecto: Soto Montalvo Herranz y Eduardo García Pardo
Palabras clave
Citación
Colecciones
Excepto si se señala otra cosa, la licencia del ítem se describe como Atribución-NoComercial-SinDerivadas 3.0 España