SSD vs. YOLO for Detection of Outdoor Urban Advertising Panels under Multiple Variabilities

Resumen

Los modelos de detección de objetos Single Shot MultiBox Object Detector (SSD) y You Only Look Once (YOLO), basados en redes neuronales profundas, han sido utilizados en este trabajo para la detección automática de paneles publicitarios en ambientes exteriores, considerando múltiples tipos de variabilidades combinadas en las escenas. La detección automática de paneles publicitarios en imágenes tiene importantes aplicaciones tanto en el mundo real como en el virtual. Una de sus potenciales aplicaciones es su uso en Google Street View para calcular localizaciones donde poder colocar publicidad en Internet, pues la detección de paneles publicitarios en imágenes permitirá reemplazarlos por otros anuncios de empresas patrocinadoras. En nuestros experimentos, tanto los detectores SSD como YOLO produjeron resultados aceptables bajo diferentes tamaños de paneles, condiciones de iluminación, perspectivas de visión, oclusión parcial de los paneles, fondos complejos y la aparición de múltiples paneles en una misma escena. Debido a la dificultad de encontrar imágenes anotadas para el problema considerado, en este trabajo se ha creado un conjunto de datos propio para realizar los experimentos. La principal fortaleza del modelo SSD fue la casi inexistencia de Falsos Positivos (FP), algo que es necesario en aplicaciones en las que se requiera localizar y analizar el contenido de los carteles. Por otro lado, YOLO produjo mejores resultados de localización de paneles y un mayor número de Verdaderos Positivos, ofreciendo mayor precisión. Por último, también se incluye una comparativa entre los dos modelos de detección de objetos analizados, con otros tipos de redes de segmentación semántica, utilizando las mismas métricas de evaluación.

Descripción

Citación

Morera, Á.; Sánchez, Á.; Moreno, A.B.; Sappa, Á.D.; Vélez, J.F. SSD vs. YOLO for Detection of Outdoor Urban Advertising Panels under Multiple Variabilities. Sensors 2020, 20, 4587. https://doi.org/10.3390/s20164587
license logo
Excepto si se señala otra cosa, la licencia del ítem se describe como Attribution 4.0 International