CLASIFICACIÓN AUTOMÁTICA DE DOCUMENTOS MEDIANTE REDES NEURONALES
Fecha
2024-07-02
Autores
Título de la revista
ISSN de la revista
Título del volumen
Editor
Universidad Rey Juan Carlos
Resumen
En este documento se describe un Trabajo de Fin de Grado (TFG) que aborda el problema de la clasificación automática de documentos en papel digitalizados. Entre los tipos de documentos tratados en este proyecto se pueden citar: DNI, pasaportes o facturas.
Este proyecto aborda la problemática de la clasificación de tipos de documentos desde un punto de vista realista, gracias a la muestra proporcionada por la empresa privada Addalia que se dedica a estos menesteres. Así, las imágenes que se han usado para construir el sistema de clasificación pueden llegar con diferente orientación, ruido y cambios de nitidez.
Para resolver este problema se han utilizado dos arquitecturas profundas de neuronas artificiales. Por un lado, se ha entrenado una red de convolución (CNN) para detectar si los documentos vienen girados. Por otro lado, se ha entrenado una red de tipo Inception para detectar el tipo de documento. Además, se ha entrenado una tercera red de tipo CNN, para poder comparar los resultados ofrecidos por la red Inception con los ofrecidos por otra arquitectura más simple.
En la parte experimental de este TFG se comparan los resultados de ambas propuestas. Se constata una ventaja en precisión del enfoque basado en la red Inception, aún cuando ambas han sido entrenadas durante aproximadamente el mismo tiempo, y con la misma muestra de aprendizaje.
Además, se ha construido un prototipo que permite ofrecer respuestas, sobre la tipología de un documento, a través de una red de comunicaciones, convirtiendo el sistema en una solución de Software como Servicio (SaaS por sus siglas en inglés).
Descripción
Trabajo Fin de Grado leído en la Universidad Rey Juan Carlos en el curso académico 2023/2024. Directores/as: José Francisco Vélez Serrano
Palabras clave
Citación
Colecciones
Excepto si se señala otra cosa, la licencia del ítem se describe como