Video Processing and Understanding Lab
Universidad Autónoma de Madrid
Escuela Politécnica Superior

PID2021-125051OB-I00 HVD (2022-2025)
Harvesting Visual Data: enabling computer vision in unfavourable data scenarios

HVD_logo
Supported by the
Ministerio de Ciencia e Innovación
of the Spanish Goverment
MCI_logo
Publications

Journals

  1. Javier Montalvo, Álvaro García-Martín, and Jesus Bescós, “Exploiting Semantic Segmentation to Boost Reinforcement Learning in Video Game Environments”. Multimedia Tools and Applications, 82, 10961–10979, March 2023. Electronic ISSN 1573-7721, Print ISSN 1380-7501. DOI 10.1007/s11042-022-13695-1 [OpenAccess]
    This work is part of the preliminary tasks related to the Harvesting Visual Data (HVD) project (PID2021-125051OB-I00) funded by the Ministerio de Ciencia e Innovación of the Spanish Government.
  2. Paula Moral, Álvaro García-Martín, José M. Martínez, and Jesus Bescós, “Enhancing Vehicle Re-Identification Via Synthetic Training Datasets and Re-ranking Based on Video-Clips Information”. Multimedia Tools and Applications, Online 21 March 2023. Electronic ISSN 1573-7721, Print ISSN 1380-7501. DOI 10.1007/s11042-023-14511-0 [OpenAccess]
    This work is part of the preliminary tasks related to the Harvesting Visual Data (HVD) project (PID2021-125051OB-I00) funded by the Ministerio de Ciencia e Innovación of the Spanish Government.
  3. Roberto Alcover-Couso, Juan C. SanMiguel, Marcos Escudero-Viñolo, and Alvaro García-Martín, “On exploring weakly supervised domain adaptation strategies for semantic segmentation using synthetic data”. Multimedia Tools and Applications, Online 11 March 2023. Electronic ISSN 1573-7721, Print ISSN 1380-7501. DOI 10.1007/s11042-023-14662-0 [OpenAccess]
    This work is part of the preliminary tasks related to the Harvesting Visual Data (HVD) project (PID2021-125051OB-I00) funded by the Ministerio de Ciencia e Innovación of the Spanish Government.
  4. Juan Ignacio Bravo Pérez-Villar, Álvaro García-Martín, Jesús Bescós, Marcos Escudero-Viñolo, "Spacecraft Pose Estimation: Robust 2D and 3D-Structural Losses and Unsupervised Domain Adaptation by Inter-Model Consensus", IEEE Transactions on Aerospace and Electronic Systems, Online 21 August 2023. Electronic ISSN: 1557-9603 , Print ISSN: 0018-9251. DOI 10.1109/TAES.2023.3306731
  5. Roberto Alcover-Couso, Juan C. SanMiguel, Marcos Escudero-Viñolo, and Pablo Carballeira, "Per-class curriculum for Unsupervised Domain Adaptation in semantic segmentation", The Visual Computer, Online 15 April 2024. Electronic ISSN1432-2315, Print ISSN 0178-2789 . DOI 10.1007/s00371-024-03373-8 [OpenAccess]

Conferences

  1. Juan C. SanMiguel, Jorge Muñoz, and Fabio Poiesi, "Detection-aware multi-object tracking evaluation," 2022 18th IEEE International Conference on Advanced Video and Signal Based Surveillance (AVSS), Madrid, Spain, November 2022, pp. 1-8. (ISBNprint 978-1-6654-6383-6, ISBNelectronic 978-1-6654-6382-9) (DOI 10.1109/AVSS56176.2022.9959412)
    This work is part of the preliminary tasks related to the Harvesting Visual Data (HVD) project (PID2021-125051OB-I00) funded by the Ministerio de Ciencia e Innovación of the Spanish Government.
  2. Roberto Alcover, Juan C. SanMiguel, Marcos Escudero, "Biased Class disagreement: detection of out of distribution instances by using differently biased semantic segmentation models", IEEE International Conference on Computer Vision Workshops 2023 (ICCV), Workshop on Uncertainty Quantification for Computer Vision, Paris (France), Oct. 2023, pp. 4580-4588.
  3. Xuanling Yu et al., "The Robust Semantic Segmentation UNCV2023 Challenge Results", IEEE International Conference on Computer Vision Workshops 2023 (ICCV), Workshop on Uncertainty Quantification for Computer Vision, Paris (France), Oct. 2023, pp. 4618-4628.
  4. Cecilia Diana Albelda, Juan Ignacio Bravo Pérez-Villar, Javier Montalvo, Álvaro García Martín, Jesús Bescós Cano, "Self-Supervised Monocular Depth Estimation on Unseen Synthetic Cameras", 26th Iberoamerican Congress on Pattern Recognition (CIAPR), Coimbra (Portugal), Nov. 2023.
  5. Paula Moral, Alvaro Garcia-Martin, Jose M. Martinez, "Vehicle Re-Identification based on unsupervised domain adaptation by incremental generation of Pseudo-labels", 26th Iberoamerican Congress on Pattern Recognition (CIAPR), Coimbra (Portugal), Nov. 2023.
  6. Pablo Marcos-Manchón, Roberto Alcover-Couso, Juan Carlos SanMiguel, José M. Martínez, "Open-Vocabulary Attention Maps with Token Optimization for Semantic Segmentation in Diffusion Models",IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), Seattle (USA), Jun. 2024. (arxiv available at https://arxiv.org/abs/2403.14291)
  7. Cecilia Diana Albelda, Roberto Alcover; Álvaro García Martín, Jesús Bescós Cano, "How SAM Perceives Different mp-MRI Brain Tumor Domains?", 4th Workshop on Domain adaptation, Explainability, Fairness in AI for Medical Image Analysis (DEF-AI-MIA) in conjunction with the IEEE Computer Vision and Pattern Recognition Conference (CVPR), Seattle (USA), Jun. 2024.

PhD thesis

Under development

  • Detección y asociación de objetos en escenarios multivista (Detection and association of objets in multiview scenarios), Paula Moral de Eusebio (advisors: Álvaro García-Martín, José M. Martínez), Tesis Doctoral (PhD Thesis), Programa de Doctorado en Ingeniería Informática y de Telecomunicación, Univ. Autónoma de Madrid.
  • Técnicas de Visión Artificial Verificables y Explicables Para Navegación Basada en Visión Alrededor de Objetos Desconocidos (Verifiable and Explainable Machine Vision Techniques for Vision-Based Navigation around Unknown Objects), Juan Ignacio Bravo Pérez-Villar (advisors: Álvaro García-Martín, Jesús Bescós Cano), Tesis Doctoral (PhD Thesis), Programa de Doctorado en Ingeniería Informática y de Telecomunicación, Univ. Autónoma de Madrid.
  • Self-supervised deep learning from unlabeled medical images, Kirill Sirotkin (advisors: Marcos Escudero, Pablo Carballeria), Tesis Doctoral (PhD Thesis), Programa de Doctorado en Ingeniería Informática y de Telecomunicación, Univ. Autónoma de Madrid.
  • Detección y segmentación en imágenes con datos sintéticos (Detection and Segmentation in Images using Synthetic Data), Roberto Alcover Couso (advisors: Juan Carlos San Miguel, Marcos Escudero), Tesis Doctoral (PhD Thesis), Programa de Doctorado en Ingeniería Informática y de Telecomunicación, Univ. Autónoma de Madrid.
  • Aprendizaje Profundo con Redes Adversarias y Datos Sintéticos (Depp Learning with Adversarial Netowrks and Synthetic Data), Javier Montalvo Rodrigo (advisors: Álvaro García Martín, Pablo Carballeira), Tesis Doctoral (PhD Thesis), Programa de Doctorado en Ingeniería Informática y de Telecomunicación, Univ. Autónoma de Madrid.
  • Análisis de imagen medica mediante técnicas de aprendizaje profundo (Medical image analysis using deep learning techniques), Cecilia Diana Albelda (advisors: Jesús BEscós Cano, Álvaro García Martín), Tesis Doctoral (PhD Thesis), Programa de Doctorado en Ingeniería Informática y de Telecomunicación, Univ. Autónoma de Madrid.

Master thesis

  1. Self-supervised monocular Depth estimation and visual odometry on unseen synthetic cameras, Cecilia Diana Alberla (advisor: Juan Ignacio Braco Pérez-Villas; lecturer: Álvaro García-Martín), Trabajo Fin de Máster (Master Thesis), Máster Universitario en Deep Learning for Audio and Visual Signal Processing, Univ. Autónoma de Madrid, Jun. 2023.
  2. Deep Learning modelling od intensity signals for synthetic Lidar data generation, Andrés Gómez-Caraballo Yélamos (advisor: Javier Montalvo Rodrigo; lecturer: Pablo Carballeria López), Trabajo Fin de Máster (Master Thesis), Máster Universitario en Deep Learning for Audio and Visual Signal Processing, Univ. Autónoma de Madrid, Jun. 2023.
  3. Synthetic data generation using latent diffusion models for semantic segmentation of urban scenes, Pablo Marcos Manchón (advisor: Juan Carlos San Miguel Avedillo), Trabajo Fin de Máster (Master Thesis), Máster Universitario en Deep Learning for Audio and Visual Signal Processing, Univ. Autónoma de Madrid, Jun. 2023.
  4. Design and evaluation of a dataset for detection and geopositioning of urban elements, Juan José López Castilla (advisor: Álvaro García-Martín) Trabajo Fin de Máster (Master Thesis), Máster Universitario en Deep Learning for Audio and Visual Signal Processing, Univ. Autónoma de Madrid, Sep. 2023.
  5. Design and evaluation of a dataset for detection and geopositioning of urban elements, Juan José López Castilla (advisor: Álvaro García-Martín) Trabajo Fin de Máster (Master Thesis), Máster Universitario en Deep Learning for Audio and Visual Signal Processing, Univ. Autónoma de Madrid, Sep. 2023.
  6. Cataloging and monitoring vegetaion in urban environments using geo-positioned images, Rafael López García (advisor: Marcos Escudero-Viñolo), Trabajo Fin de Máster, Máster Universitario en Deep Learning for Audio and Visual Signal Processing, Univ. Autónoma de Madrid, Dec. 2023.
  7. Multi-camera multi-target tracking of vehicles using graph neural networks, Héctor Mejía Dávila (advisor: Juan Carlos San Miguel Avedillo), Trabajo Fin de Máster (Master Thesis), Máster Universitario en Ciencia de Datos, Univ. Autónoma de Madrid, Feb. 2024.

Under development

  • Design and evaluation of a dataset for urban elements re-identification, Javier Galán Fernández (advisor: Álvaro García Martín), Trabajo Fin de Máster (Master Thesis), Máster Universitario en Deep Learning for Audio and Visual Signal Processing, Univ. Autónoma de Madrid, (Jan. 2024)
  • Urban geopositioning and assessment through artificial vision: integration of continual learning for efficient strategies, Miguel González Rodríguez (advisor: Álvaro García Martín), Trabajo Fin de Máster (Master Thesis), Máster Universitario en Deep Learning for Audio and Visual Signal Processing, Univ. Autónoma de Madrid, (Jan. 2024)
  • Synthetic data generation using latent diffusion models for semantic segmentation of urban scenes, Henrietta Ridley (advisor: Juan Carlos San Miguel Avedillo), Trabajo Fin de Master (Master Thesis), Master Universitario en Deep Learning for Audio and Video Signal Processing, Univ. Autónoma de Madrid, (Jan. 2024)
  • Graph Convolutional Neural Networks for Multi-Camera Multi-Object Vehicle Tracking Laura Pedrouzo Rodriguez (advisor: Juan Carlos San Miguel Avedillo), Trabajo Fin de Master (Master Thesis), Master Universitario en Deep Learning for Audio and Video Signal Processing, Univ. Autónoma de Madrid, (Jan. 2024)
  • Attention-based segmentation masks generation using latent diffusion models for multiple elements of urban scenes, Daniel Beteta Francisco (ADVISOR: Juan Carlos San Miguel Avedillo), Trabajo Fin de Master (Master Thesis), Master Universitario en Ciencia de Datos, Univ. Autónoma de Madrid, (Jan. 2024)

Graduate thesis

  1. Clasificación auto-supervisada de imágenes mediante aprendizaje contrastivo (Auto-supervised image classficiation based on contrastive learning), Alejandro Guzmán Huerta (advisor: Miguel Ángel García), Trabajo Fin de Grado (Graduate Thesis), Grado en Ingeniería Informática, Univ. Autónoma de Madrid, Feb. 2023.
  2. Clasificación auto-supervisada de imágenes mediante aprendizaje no-contrastivo (Auto-supervised image classficiation based on non-contrastive learning), Franciso Lerma Martínez (advisor: Miguel Ángel García García), Trabajo Fin de Grado (Graduate Thesis), Grado en Ingeniería Informática, Univ. Autónoma de Madrid, May 2023.
  3. Clasificación auto-supervisada de imágenes mediante contraste de momento (Auto-supervised image classficiation based on momentum contrast), Víctor Sánchez de la Roda Nuñez (advisor: Miguel Ángel García), Trabajo Fin de Grado (Graduate Thesis), Grado en Ingeniería Informática (Programa de Doble Grado Ing. Informática y Matemáticas), Univ. Autónoma de Madrid, Jul. 2023.
  4. Contribuciones a la simulación de sistemas multi-cámara basado en UNITY (Contributions to the simulation of UNITY-based multi-camera systems), Miguel Bellido González del Alba (advisor: Juan C. SanMiguel), Trabajo Fin de Grado (Graduate Thesis), Grado en Tecnologías y Servicios de Telecomunicación, Univ. Autónoma de Madrid, Jul. 2023.
  5. Interpretabilidad de redes neuronales de clasificación de imágenes mediante el cálculo de sus márgenes (Aiding interpretability of deep learning model by calculation of the decision margins), Anisha Anil Sujanani (advisor: Kiril Sirotkin; lecturer: Marcos Escudero-Viñolo), Trabajo Fin de Grado (Graduate Thesis), Grado en Ingeniería de Tecnologías y Servicios de Telecomunicación, Univ. Autónoma de Madrid, Sept. 2023.
  6. Estado actual del EU-AI Act: evolución, contenido, y perspectivas (Current state of the EU-AI Act: evolution, content, and prospects), Olivia Merezeanu (advisor: Marcos Escudero-Viñolo), Trabajo Fin de Grado (Graduate Thesis), Grado en Ingeniería de Tecnologías y Servicios de Telecomunicación, Univ. Autónoma de Madrid, Jan. 2024.
  7. Estudio de las regiones de decisión de modelos vision transformers (Study of the Decision Regions of Vision Transformers Models), Patricia Serrano (advisor: Marcos Escudero-Viñolo), Trabajo Fin de Grado (Graduate Thesis), Grado en Ingeniería de Tecnologías y Servicios de Telecomunicación, Univ. Autónoma de Madrid, May. 2024.

Under development

  • Aprendizaje auto supervisado para análisis de imágenes en dominios no convencionales: Apoyo a la diagnosis de Retinopatía Diabética (Self-supervised learning for image analysis in unconventional domains: Supporting the diagnosis of Diabetic Retinopathy), Sandra Pérez Yerga (advisor: Marcos Escudero-Viñolo), Trabajo Fin de Grado (Graduate Thesis), Grado en Ingeniería de Tecnologías y Servicios de Telecomunicación, Univ. Autónoma de Madrid (Sept. 2021)
  • Aprendizaje auto supervisado para análisis de imágenes en dominios no convencionales: Apoyo a la diagnosis de melanoma (Self-Supervised Learning for Image Analysis in Unconventional Domains: Supporting Melanoma Diagnosis), Sara Álvarez Martínez (advisor: Marcos Escudero-Viñolo), Trabajo Fin de Grado (Graduate Thesis), Grado en Ingeniería de Tecnologías y Servicios de Telecomunicación, Univ. Autónoma de Madrid (Sept. 2021)
  • Desarrollo de algoritmos de deep learning autosupervisado para la clasificación de imágenes médicas (Development of self-supervised deep learning algorithms for the classification of medical images), Eduardo García del Rio (advisor: Pablo Carballeria) Trabajo Fin de Grado (Graduate Thesis), Grado en Ingeniería de Tecnologías y Servicios de Telecomunicación, Univ. Autónoma de Madrid (Sept. 2023)
  • Generación de un escenario de pruebas para la detección y geo-posicionamiento de elementos urbanos (Generation of a test scenario for the detection and geo-positioning of urban elements), Lucia Garavis Hernandez (advisor: Álvaro García Martín), Trabajo Fin de Grado (Graduate Thesis), Grado en Ingeniería de Tecnologías y Servicios de Telecomunicación, Univ. Autónoma de Madrid (Sept. 2023)
  • Detección y geo-posicionamiento de farolas en entornos urbanos (Detection and geo-positioning of streetlights in urban environments), Jorge Dario Espinosa Fernandez (advisor: Álvaro García Martín), Trabajo Fin de Grado (Graduate Thesis), Grado en Ingeniería de Tecnologías y Servicios de Telecomunicación, Univ. Autónoma de Madrid (Sept. 2023)
  • Detection of faces and license plates for anonymization in urban environments (Detection of faces and license plates for anonymization in urban environments), Kevin Andres Narvaez Ocampo (advisor: Álvaro García Martín), Trabajo Fin de Grado (Graduate Thesis), Grado en Ingeniería de Tecnologías y Servicios de Telecomunicación, Univ. Autónoma de Madrid (Sept. 2023)
  • Detección y geo-posicionamiento de señales de tráfico en entornos urbanos (Detection and geo-positioning of traffic signs in urban environments), Sergio Ramos del Rio (advisor: Álvaro García Martín), Trabajo Fin de Grado (Graduate Thesis), Grado en Ingeniería de Tecnologías y Servicios de Telecomunicación, Univ. Autónoma de Madrid (Sept. 2023)
  • Detección y geo-posicionamiento multi objeto entre diferentes entornos urbanos (Multi-object detection and geo-positioning between different urban environments), Andrea Zamora Lara Lara (advisor: Álvaro García Martín), Trabajo Fin de Grado (Graduate Thesis), Grado en Ingeniería de Tecnologías y Servicios de Telecomunicación, Univ. Autónoma de Madrid (Sept. 2023)
  • Segmentación de gliomas mediante técnicas de aprendizaje profundo (Glioma segmentation Using Deep Learning techniques), Celia de la Fuente Moreno (advisor: Álvaro García Martín), Trabajo Fin de Grado (Graduate Thesis), Grado en Ingeniería Biomédica, Univ. Autónoma de Madrid (Sept. 2023)
  • Aprendizaje incremental de clases mediante el entorno Avalanche (Incremental classroom learning through the Avalanche environment), Isaac Barriales Domínguez (advisor: Miguel Ángel García), Trabajo Fin de Grado (Graduate Thesis), Grado en Ingeniería Informática, Univ. Autónoma de Madrid (Oct. 2023)
  • Aprendizaje incremental de clases mediante el entorno PyCIL (Classes incremental learning using the PyCIL environment), Félix Antonio Estaún Bescós (advisor: Miguel Ángel García), Trabajo Fin de Grado (Graduate Thesis), Grado en Ingeniería Informática, Univ. Autónoma de Madrid (Apr. 2024)
  • Introducción a la segmentación de neuronas en imagen médica con aprendizaje profundo (Introducción a la segmentación de neuronas en imagen médica con aprendizaje profundo), Trabajo Fin de Grado (Graduate Thesis), Paula Escudero Benítez (advisor: Juan Carlos San Miguel Avedillo), Grado en Ingeniería Biomédica, Univ. Autónoma de Madrid (Sept. 2023)
  • Detección y segmentación de tumores cerebrales con YOLOv8 (Brain Tumor Detection and Segmentation with YOLOv8), Miguel Díaz Benito (advisor: Juan Carlos San Miguel Avedillo), Trabajo Fin de Grado (Graduate Thesis), Grado en Ingeniería Biomédica, Univ. Autónoma de Madrid (Sept. 2023)
  • Introducción a la clasificación de cáncer de piel en imágenes con Aprendizaje Profundo (Introduction to Skin Cancer Classification in Deep Learning Imaging), Marietta Roba Fraguas (advisor: Juan Carlos San Miguel Avedillo), Trabajo Fin de Grado (Graduate Thesis), Grado en Ingeniería Biomédica, Univ. Autónoma de Madrid (Sept. 2023)
  • Aprendizaje para anotación automática de imágenes sintéticas basadas en Modelos de Difusión (Learning for Automatic Annotation of Synthetic Images Based on Diffusion Models), Javier Martínez Peco (advisor: Juan Carlos San Miguel Avedillo), Trabajo Fin de Grado (Graduate Thesis), Grado en Ingeniería Informática, Univ. Autónoma de Madrid (Sept. 2023)
  • Generación de imágenes sintéticas anotadas automáticamente basada en Modelos de Difusión (Generation of automatic annotated synthetic images based on Diffusion Models), Alejandra Parés Rodriguez Rodriguez (advisor: Juan Carlos San Miguel Avedillo), Trabajo Fin de Grado (Graduate Thesis), Grado en Ingeniería Informática, Univ. Autónoma de Madrid (Sept. 2023)
Last update 30/04/2024