Parametrización óptima de un banco de filtros de Gabor para su aplicación a un problema de reconocimiento facial
Abstract
Los sistemas de reconocimiento facial automático se han desarrollado a gran velocidad en los últimos años. Estos sistemas idenfican a una persona mediante imágenes faciales, que previamente se han debido analizar y almacenar. Mediante un proceso de entrenamiento, el sistema "aprende" a reconocer a cada persona enrolada (cliente) y a rechazar a los impostores. Uno de los métodos más utilizados en reconocimiento facial se basa en los llamados wavelets de Gabor, que forman un banco o conjunto de filtros capaces de extraer información sobre la frecuencia espacial y la orientación de las texturas de la imagen [Daug80]. Desde los trabajos de Lades et al. [Lade93] y Wiskott et al. [Wisk97], han surgido múltiples algoritmos de reconocimiento facial basados en wavelets de Gabor. Muchos utilizan la parametrización de 40 filtros (5 frecuencias y 8 orientaciones) del banco de Lades y Wiskott, todo un "estándar" hoy en día (banco "clásico"). Sin embargo, algunos autores han considerado menos filtros o han cambiado los parámetros de sus bancos, a menudo sin justificación aparente. El objetivo de este proyecto es estudiar varias parametrizaciones de los bancos de filtros de Gabor (un total de 486) y su influencia en la tasa de reconocimiento en un problema de reconocimiento facial. Los experimentos se han realizado con dos bases de datos faciales de la literatura, la XM2VTS [Mess03] y la FRAV2D [FRAV2D] [Serr07]. Los vectores de características extraídos mediante Gabor han sido reducidos con un Análisis de Componentes Principales (PCA) [Turk91], tanto para una representación analítica como holística. La comparación de vectores la hemos realizado con un clasificador de k vecinos (k-NN). Por último, el estudio estadístico de los resultados lo hemos realizado con un análisis de varianza (ANOVA) de seis factores. Como principal resultado, sugerimos utilizar un banco de Gabor con 6 frecuencias, en vez de 5, y 8 orientaciones, dando lugar a un total de 48 filtros. La anchura de la envolvente gaussiana debe hacerse más estrecha para así abarcar más frecuencias en el dominio de Fourier. Para los otros dos parámetros del banco, la frecuencia máxima y el espaciado, no hemos encontrado un valor óptimo claro, así que sugerimos mantener el del banco clásico.
Description
Proyecto Fin de Máster del Máster Oficial en Tecnologías de la Información y Sistemas Informáticos
Collections
- Trabajos Fin de Máster [111]
Los ítems de digital-BURJC están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario