CLASIFICACIÓN AUTOMÁTICA DE DOCUMENTOS MEDIANTE REDES NEURONALES

Fecha

2024-07-02

Título de la revista

ISSN de la revista

Título del volumen

Editor

Universidad Rey Juan Carlos

Resumen

En este documento se describe un Trabajo de Fin de Grado (TFG) que aborda el problema de la clasificación automática de documentos en papel digitalizados. Entre los tipos de documentos tratados en este proyecto se pueden citar: DNI, pasaportes o facturas. Este proyecto aborda la problemática de la clasificación de tipos de documentos desde un punto de vista realista, gracias a la muestra proporcionada por la empresa privada Addalia que se dedica a estos menesteres. Así, las imágenes que se han usado para construir el sistema de clasificación pueden llegar con diferente orientación, ruido y cambios de nitidez. Para resolver este problema se han utilizado dos arquitecturas profundas de neuronas artificiales. Por un lado, se ha entrenado una red de convolución (CNN) para detectar si los documentos vienen girados. Por otro lado, se ha entrenado una red de tipo Inception para detectar el tipo de documento. Además, se ha entrenado una tercera red de tipo CNN, para poder comparar los resultados ofrecidos por la red Inception con los ofrecidos por otra arquitectura más simple. En la parte experimental de este TFG se comparan los resultados de ambas propuestas. Se constata una ventaja en precisión del enfoque basado en la red Inception, aún cuando ambas han sido entrenadas durante aproximadamente el mismo tiempo, y con la misma muestra de aprendizaje. Además, se ha construido un prototipo que permite ofrecer respuestas, sobre la tipología de un documento, a través de una red de comunicaciones, convirtiendo el sistema en una solución de Software como Servicio (SaaS por sus siglas en inglés).

Descripción

Trabajo Fin de Grado leído en la Universidad Rey Juan Carlos en el curso académico 2023/2024. Directores/as: José Francisco Vélez Serrano

Citación