Examinando por Autor "Barreiro-Garrido, Alvaro"
Mostrando 1 - 3 de 3
- Resultados por página
- Opciones de ordenación
Ítem A Pix2Pix Architecture for Complete Offline Handwritten Text Normalization(MDPI, 2024-06-16) Barreiro-Garrido, Alvaro; Ruiz-Parrado, Victoria; Moreno, A. Belen; Velez, Jose F.En el ámbito del reconocimiento de texto manuscrito offline, a lo largo de los años se han desarrollado numerosos algoritmos de normalización que sirven como pasos de preprocesamiento antes de aplicar modelos automáticos de reconocimiento a imágenes de texto manuscrito escaneadas. Estos algoritmos han demostrado ser efectivos en mejorar el rendimiento general de las arquitecturas de reconocimiento. Sin embargo, muchos de estos métodos dependen en gran medida de estrategias heurísticas que no están integradas de manera fluida con la propia arquitectura de reconocimiento. Este artículo introduce el uso de un modelo entrenable Pix2Pix, un tipo específico de red generativa antagónica condicional, como el método para normalizar imágenes de texto manuscrito. Además, este algoritmo puede integrarse sin problemas como la etapa inicial de cualquier arquitectura de aprendizaje profundo diseñada para tareas de reconocimiento manuscrito. Todo esto facilita el entrenamiento de los componentes de normalización y reconocimiento como un todo unificado, manteniendo al mismo tiempo cierta interpretabilidad de cada módulo. Nuestro enfoque de normalización propuesto aprende de una combinación de transformaciones heurísticas aplicadas a imágenes de texto, con el objetivo de mitigar el impacto de la variabilidad intra-personal de la escritura entre diferentes escritores. Como resultado, se logran normalizaciones de pendiente e inclinación, junto con otros objetivos convencionales de preprocesamiento, como la normalización del tamaño de los ascenders y descenders en las palabras del texto. Este trabajo muestra que la arquitectura propuesta replica, y en ciertos casos supera, los resultados de un algoritmo heurístico ampliamente utilizado en dos métricas y cuando se integra como el primer paso de una arquitectura de reconocimiento profundo.Ítem A Study on Automatic Analysis of Handwriting Alterations Due to Parkinson’s Disease(Springer, 2024-11-16) Casademunt, Alberto; Barreiro-Garrido, Alvaro; Moreno , A. Belén; Vélez, José F.; Sánchez, ÁngelLa enfermedad de Parkinson es una condición neurodegenerativa crónica que causa temblores, rigidez y bradicinesia, entre otros síntomas. Estos síntomas pueden manifestarse como alteraciones en la escritura manuscrita, características de la enfermedad de Parkinson, lo que resulta en distorsiones en los trazos de la escritura y también en interrupciones en la fluidez de la escritura de los sujetos (es decir, la degradación de las habilidades motoras al escribir). Este trabajo describe un estudio cuyo objetivo es realizar la detección de alteraciones producidas por el Parkinson en partes de los textos manuscritos, así como identificar qué elementos textuales (por ejemplo, letras, sílabas, ...) son principalmente "parkinsonianos". Para lograr tal propósito, hemos utilizado una Red Neuronal Convolucional (CNN) y la base de datos PaHaW de escritura manuscrita que contiene pacientes sanos y otros con la enfermedad de Parkinson incluyendo diferentes grados de severidad de la misma. Se realizaron una serie de experimentos de predicción en diferentes textos manuscritos de esta base de datos, los cuales produjeron unos resultados promedio de precisión de predicción superiores al 65%.Ítem On the influence of artificially distorted images in firearm detection performance using deep learning(PeerJ, 2024-10-18) Corral-Sanz, Patricia; Barreiro-Garrido, Alvaro; Moreno, A. Belen; Sanchez, AngelDetectar personas que portan armas de fuego en escenas exteriores o interiores generalmente permite identificar (o evitar) situaciones potencialmente peligrosas. Sin embargo, la detección automática de estas armas puede verse gravemente afectada por las condiciones de la escena. Comúnmente, en situaciones reales, estas armas pueden ser vistas desde diferentes perspectivas. También pueden tener tamaños variados y apariencias diferentes. Además, las imágenes que contienen estos objetos suelen ser complejas, y las armas de fuego pueden aparecer parcialmente ocluidas. Es común que las imágenes puedan verse afectadas por varios tipos de distorsiones, como: ruido impulsional, oscurecimiento de la imagen o desenfoque, entre otras. Todas estas variabilidades percibidas podrían degradar significativamente la precisión de la detección de armas de fuego. Las redes de detección profundas actuales ofrecen una buena precisión de clasificación, con alta eficiencia y usando recursos computacionales restringidos. Sin embargo, la influencia de las condiciones prácticas en las que se deben detectar estos objetos no ha sido suficientemente analizada. Nuestro artículo describe un estudio experimental sobre cómo un conjunto de distorsiones de imagen seleccionadas degrada cuantitativamente el rendimiento de la detección en imágenes de prueba, cuando las redes de detección solo han sido entrenadas con imágenes que no presentan dichas alteraciones. Las distorsiones de imágenes de prueba analizadas incluyen ruido impulsional, desenfoque, oscurecimiento de la imagen, reducción del tamaño de la imagen y oclusiones. Para cuantificar el impacto de cada distorsión individual en el problema de detección de armas, hemos utilizado una red estándar YOLOv5. Nuestros resultados experimentales han mostrado que la adición creciente de ruido de tipo sal-y-pimienta es, con mucho, la distorsión que más afecta el rendimiento de la red de detección.