Proyecto
PID2021-125051OB-I00 (HVD): Recolección de datos visuales: permitiendo la visión por computador en escenarios con datos desfavorables (2022-2025)El objetivo principal de este proyecto es reducir la enorme dependencia que tienen la IA y los
algoritmos Deep CNN de la disponibilidad de datos de entrenamiento anotados. Los datos son la
condición que habilitan los modelos de CV en la actualidad. A pesar de haber recibido una atención
sustancialmente menor que los algoritmos, métodos o modelos, se están haciendo cada vez más
esfuerzos para proporcionar repositorios accesibles a gran escala, por ejemplo, fomentando el acceso
justo a los datos y el intercambio de datos. Con respecto a la disponibilidad de datos anotados,
dado que las soluciones de vanguardia actuales se basan principalmente en enfoques de aprendizaje
supervisado, su éxito requiere la disponibilidad de grandes conjuntos de datos anotados por humanos
(como ImageNet) que dependen de una gran cantidad de supervisión en tiempo y esfuerzo. Además, para
algunos dominios sensibles, como los accidentes de tráfico, las anotaciones y el contenido rara vez
están disponibles. Algunas aplicaciones requieren una adición continua de datos o anotaciones
mientras se mantienen los pesos del modelo previamente entrenados, por ejemplo, debido a la
inclusión de tareas o clases adicionales para predecir. Además, estos sistemas así entrenados
generalmente se adaptan a una tarea específica y no pueden adaptarse a otras tareas sin
reentrenamiento. Para hacer frente a estos problemas, se ha dedicado un gran esfuerzo de
investigación a lograr sistemas que puedan: modelar los patrones intrínsecos en los datos sin
aprovechar (completamente) el etiquetado humano; adaptar continuamente el proceso de aprendizaje a
la disponibilidad de nuevos datos adicionales; y extrapolar el aprendizaje de información útil
utilizando conjuntos de datos sintéticos complementarios para los que se puede obtener una anotación
automática. En esta dirección, proponemos 1) explorar el uso de datos reales en ausencia de
anotaciones a través de enfoques no supervisados y autosupervisados; y 2) explorar la creación y uso
de datos sintéticos para complementar el proceso de aprendizaje
Participants: Universidad Autónoma de Madrid
Main researcher: Garcia-Martin, Alvaro
Web link: PID2021-125051OB-I00 (HVD)
External Publications:
Journals
- Javier Montalvo, Alvaro Garcia-Martin, Jesús Bescós : "Exploiting Semantic Segmentation to Boost Reinforcement Learning in Video Game Environments", Multimedia Tools and Applications
- Roberto Alcover, Juan C. SanMiguel, Marcos Escudero, Alvaro Garcia-Martin : "On exploring weakly supervised domain adaptation strategies for semantic segmentation using synthetic data", Multimedia Tools and Applications (En prensa)
- Juan I. Bravo, Alvaro Garcia-Martin, Jesús Bescós, Marcos Escudero : "Spacecraft Pose Estimation: Robust 2D and 3D-Structural Losses and Unsupervised Domain Adaptation by Inter-Model Consensus", IEEE Transactions on Aerospace and Electronic Systems (En prensa)
Conferences
- Juan C. SanMiguel, Jorge Muñoz, Fabio Poiesi : "Detection-aware multi-object tracking evaluation", 2022 18th IEEE International Conference on Advanced Video and Signal Based Surveillance (AVSS)
- Cecilia Diana, Juan I. Bravo, Javier Montalvo, Alvaro Garcia-Martin, Jesús Bescós : "Self-Supervised Monocular Depth Estimation on Unseen Synthetic Cameras", 26th Iberoamerican Congress on Pattern Recognition (En prensa)
- Roberto Alcover, Juan C. SanMiguel, Marcos Escudero : "Biased Class disagreement: detection of out of distribution instances by using differently biased semantic segmentation models", IEEE International Conference on Computer Vision Workshops 2023, Workshop on Uncertainty Quantification for Computer Vision
- et al., Roberto Alcover, Juan C. SanMiguel, Marcos Escudero, et al. : "The Robust Semantic Segmentation UNCV2023 Challenge Results", IEEE International Conference on Computer Vision Workshops 2023, Workshop on Uncertainty Quantification for Computer Vision
Internal Publications:
Master Thesis
- Self-Supervised Monocular Depth Estimation and Visual Odometry on Unseen Synthetic Cameras, Diana Albelda, Cecilia, July 2023, (Tutor: Bravo Pérez-Villar, Juan Ignacio) , (Ponente: Garcia-Martin, Alvaro)